ML
使用共享神经网络扩展机器学习模型
译者 | 崔皓审校 | 重楼随着机器学习模型的复杂性和规模不断增长,任何企业或者组织在部署、扩展模型上都面临着巨大的挑战。 迫在眉睫的挑战是如何在内存限制与模型规模之间取得平衡,并保持高性能和成本效益。 本文探讨了一种创新的架构解决方案,通过将共享神经编码器与专门的预测头结合的混合方法来应对这些挑战。
2/24/2025 8:00:00 AM
崔皓
我们一起聊聊如何让ML和AI训练步入正轨
人工智能(AI)和机器学习(ML)已经进入企业环境。 根据IBM 的《2024 年人工智能在行动》报告,两大群体正在加入人工智能:领导者和学习者。 领导者看到了可量化的成果,三分之二的人报告收入增长了 25%(或更多)。
2/13/2025 10:09:35 AM
何威风
推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛
随着语音技术在各领域应用的迅速扩展,全球语言与口音的多样性成为技术进一步突破的重大挑战。 为了应对这一难题,来自卡内基梅隆大学(CMU)、斯坦福大学(Stanford University)、乔治梅森大学(George Mason University)、台湾大学与芝加哥丰田技术学院(TTIC)的研究团队连手,在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛(Multilingual SUPERB 2.0 Challenge)。 该挑战旨在推动多语言语音技术迈向新高度,为语音科技的全球化应用奠定坚实基础。
1/7/2025 2:49:00 PM
新闻助手
准确率达95%,混合深度学习搜索纳米生物材料,登Nature子刊
编辑 | 萝卜皮超分子肽基材料具有革新纳米技术和医学等领域的巨大潜力。 然而,破译其实际应用所必需的复杂序列到组装途径仍然是一项艰巨的任务。 它们的发现主要依赖于需要大量资金的经验方法,这阻碍了它们的颠覆性潜力。
12/12/2024 8:52:00 PM
ScienceAI
字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
近日,苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,字节大模型团队的单目深度估计模型 Depth Anything V2入选其中。CoreML是苹果公司的机器学习框架,将机器学习模型集成到iOS,MacOS等设备上高效运行,可在无需互联网连接的情况下执行复杂的AI任务,从而增强用户隐私并减少延迟。苹果开发者可以利用这些模型更容易地构建智能、安全的AI应用。Depth Anything V2为字节大模型团队开发的单目深度估计模型。相比上一代版本,V2版在细节处理上更精细,鲁棒性更强
6/28/2024 4:42:00 PM
新闻助手
可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
编辑 | X几十年来,核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。现在,在普林斯顿等离子体物理实验室(PPPL)中 ,科学家正借助人工智能,来解决人类面临的紧迫挑战:通过聚变等离子体产生清洁、可靠的能源。与传统的计算机代码不同,机器学习不仅仅是指令列表,它可以分析数据、推断特征之间的关系、从新知识中学习并适应。PPPL 研究人员相信,这种学习和适应能力可以通过多种方式改善他们对聚变反应的控制。这包括完善超热等离子体周围容器的设计、优化加热方法以及在越来越长的时间内保持反应的稳定控制。近日,PPPL 的
5/22/2024 7:20:00 PM
ScienceAI
多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷
「尽管我在顶级 ML 会议上发表了多篇一作论文,为开源项目做出了贡献,也在业界产生了影响,但我仍在为进入博士课程而苦苦挣扎。我被顶尖大学拒之门外,感到迷茫和疲惫。」「我开始怀疑自己,怀疑如果没有合适的人脉或家庭背景,光有强大的研究背景是否还不够。我正在考虑放弃攻读博士学位以及从事有价值研究的梦想。」在刚刚过去的周末,关于「AI 博士申请条件卷上天」的帖子成为了 Reddit 社区讨论的焦点。这个帖子的作者在 EMNLP、NeurIPS、ACM、ACL 等顶级会议和研讨会上以第一作者发表了多篇研究论文,也被公司评为过
4/16/2024 11:35:00 AM
机器之心
国科大&首师大合作综述,「白盒」张量网络:增强量子机器学习的可解释性和效率
编辑 | 紫罗深度机器学习在 AI 的各个领域取得了显著的成功,但同时实现高可解释性和高效率仍然是一个严峻的挑战。张量网络(Tensor Network,TN)是一种源自量子力学的成熟数学工具,在开发高效的「白盒」机器学习方案方面显示出了其独特的优势。近日,首都师范大学的冉仕举和中国科学院大学的苏刚从量子力学中汲取灵感,综述了一种基于 TN 的创新方法,为协调深度机器学习的可解释性和效率这一长期挑战提供了一个有前景的解决方案。一方面,TN ML 的可解释性可以通过基于量子信息和多体物理的坚实理论基础来实现。另一方面
12/1/2023 4:26:00 PM
ScienceAI
科学家使用外推ML方法加速发现新型催化剂
编辑 | 萝卜皮设计新型催化剂是解决许多能源和环境挑战的关键。尽管包括机器学习 (ML) 在内的数据科学方法有望加速催化剂的开发,通过机器学习方法很少发现真正新颖的催化剂,因为它最大的局限性是假设无法推断和识别特殊材料。北海道大学(Hokkaido University)的研究人员展示了一种外推机器学习方法来开发新型多元素反向水煤气变换催化剂。使用 45 个催化剂作为初始数据点,并执行闭环发现系统的44个循环(ML预测 实验),研究人员对总共 300 种催化剂进行了实验测试,并鉴定出 100 多种催化剂,这些催化剂
10/21/2023 6:04:00 PM
ScienceAI
Stable Diffusion的魅力:苹果亲自下场优化,iPad、Mac上快速出图
输入一句话就能生成图像的 Stable Diffusion 已经火爆数月。它是一个开源模型,而且在消费级 GPU 上就能运行,是一项普通人就能接触到的「黑科技」。
12/6/2022 8:53:00 PM
机器之心
UIUC信息学院汪浩瀚老师课题组招收全奖博士生及合作者,计算生物学和可信机器学习方向
新的一期博士招生正式启动!本期将为大家介绍 UIUC 信息学院汪浩瀚(Haohan Wang)老师课题组招收博士生及合作者的相关信息。学校简介UIUC,坐落于伊利诺伊州双子城厄巴纳–香槟市,是一所美国公立研究型大学。校友和教授中有 30 位获得诺贝尔奖,25 位获得普利策奖。工科专业在全球享有盛誉,几乎所有专业均位列全美前十,其中电气、土木、材料、环境、计算机均位列全美前五;会计学专业位列全美前三;信息科学专业常年位居全美第一。UIUC 校友创建或参与创建了特斯拉、甲骨文、Youtube、Paypal、AMD、Ye
11/18/2022 5:10:00 PM
机器之心
谷歌并未放弃TensorFlow,将于2023年发布新版,明确四大支柱
2015 年,谷歌大脑开放了一个名为「TensorFlow」的研究项目,这款产品迅速流行起来,成为人工智能业界的主流深度学习框架,塑造了现代机器学习的生态系统。从那时起,成千上万的开源贡献者以及众多的开发人员、社区组织者、研究人员和教育工作者等都投入到这一开源软件库上。然而七年后的今天,故事的走向已经完全不同:谷歌的 TensorFlow 失去了开发者的拥护。因为 TensorFlow 用户已经开始转向 Meta 推出的另一款框架 PyTorch。众多开发者都认为 TensorFlow 已经输掉了这场战争,并将其比
10/24/2022 3:35:00 PM
机器之心
行业现状令人失望,工作之后我又回到UC伯克利读博了
机器学习领域近来受到大模型的冲击,很多小公司表示难以承担大模型的训练费用。但行业中机器学习工程的发展具体是怎样的?
7/19/2022 2:21:00 PM
机器之心
晚上就应该睡觉?新的机器学习技术探索昼夜节律
编辑 | 雪松昼夜节律,如睡眠-觉醒周期,是大多数生物与生俱来的,对地球上的生命至关重要。昼夜时钟在 24 小时日夜周期中协调生物的各项生理变化,会间接影响我们人类的体能水平、健康程度、生存能力。同样,将新陈代谢与日出落日同步等情况也存在于植物中,准确的生物钟有助于调节开花。了解昼夜节律,于植物而言,有助于提高植物的生长和产量;于人类而言,则有可能揭示出治疗疾病的新途径。IBM欧洲研究所与厄尔汉姆研究所的合作团队,描述了一系列基于人工智能(AI)和机器学习(ML)的方法。这些方法可以进行更具成本效益的分析并深入了解
9/22/2021 11:40:00 AM
ScienceAI
综述:药物发现中的机器学习
编辑 | 萝卜皮不知不觉,人工智能已经渐渐延伸到了各个领域,医药领域也不例外。来自印度 B V Raju 理工学院的研究人员发表综述,讨论了药物发现中的机器学习,归纳总结了应用于制药领域的各类机器学习技术,并指出当前该领域发展的难点,以及未来发展方向。该综述以「Machine Learning in Drug Discovery: A Review」为题,于 2021 年 8 月 11 日发布在《Artificial Intelligence Review》杂志。人工智能概念与许多领域密切相关,如模式识别、概率论、
8/31/2021 3:21:00 PM
ScienceAI
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉