应用
CMU 周衔:聊聊物理引擎 Genesis 的源启与未来 | 具身先锋十人谈
作者 | 赖文昕编辑 | 陈彩娴不久前,我们发布《CMU 具身智能风云榜:从传统到全面》一文,介绍了来自 CMU 的一众具身智能华人人才。 就在上个月,CMU 联合18个研究机构开源发布了一个生成式物理引擎——Genesis,引起了具身智能领域的广泛讨论与关注,在国内与海外呈现出霸榜的热度。 Genesis 的核心团队为 12 位青年华人学者,其项目领导者为 CMU 机器人研究所刚毕业的博士生周衔。
1/15/2025 3:06:00 PM
赖文昕
上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考
IT之家从上海人工智能实验室获悉,其书生大模型今日获得重要版本升级——书生·浦语3.0(InternLM3)。据官方介绍,其通过精炼数据框架大幅提升了数据效率,实现思维密度的跃升。
1/15/2025 3:03:47 PM
清源
字节跳动2024奖学金公布:清华北大等八院校15名博士获奖
1月14日,字节跳动公众号公布“第四届字节跳动奖学金”评选结果,来自北京大学、北京邮电大学、清华大学、香港大学、香港城市大学、新加坡管理大学、新加坡国立大学、浙江大学(按拼音首字母排序)的15名在校生获奖,每人获得奖学金10万元人民币。 字节跳动奖学金计划是字节跳动于2021年发起的一年一期的人才培养项目。 过去三届,共有32位优秀学子获得了奖学金支持。
1/15/2025 3:01:00 PM
新闻助手
CMU 具身智能风云榜:从传统到全面
作者 | 赖文昕编辑 | 陈彩娴与位于宇宙中心硅谷湾区的伯克利、斯坦福不同,被视为锈带区复兴唯一希望的卡内基梅隆大学(以下简称“CMU”)坐落在上世纪的工业重镇匹兹堡。 计算机科学学院的机器人研究所(以下简称“RI”)成立于1979年,是世界上第一个致力于机器人研究的大学级研究所。 这座机器人摇篮在 45 年间诞生了无数耀眼成就,但在如今技术更迭到由 AI 方向领衔、以仿真与强化学习算法方为“技术先进”之际,以传统机器人学见长的 CMU 能否跟上具身智能的热潮?
1/15/2025 2:58:00 PM
赖文昕
稀宇科技发布并开源新一代 MiniMax 01 系列模型,参数量达 4560 亿
该系列模型首次大规模实现线性注意力机制,打破 Transformer 传统架构记忆瓶颈,能够处理 400 万 token 的输入,可输入长度是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。
1/15/2025 1:50:21 PM
问舟
Kimi 多模态图片理解模型 API 发布,1M tokens 定价 12 元起
Vision 模型具备图像识别能力,能够识别出图像中的复杂细节和细微的差别,无论是食物还是动物,能够区分出相似但又不相同的对象。
1/15/2025 12:24:29 PM
汪淼
领跑AI To C赛道 夸克品牌焕新“2亿人的AI全能助手”
1月15日,阿里智能信息事业群旗下夸克升级品牌Slogan—“2亿人的AI全能助手”,亮出加速探索AI To C应用的全新业务态势。 第三方数据显示,夸克用户规模持续保持高速增长,并领跑AI应用赛道,其中00后年轻用户占比超过一半。 00后AI应用第一站经过两年多的快速发展,国内AI大模型已经从比拼“模型参数”到解决“实际问题”。
1/15/2025 11:53:00 AM
新闻助手
刚刚,ChatGPT开始有了执行力!
现在 AI 智能体可以 24*7 小时为你打工。 2025 刚过去了半个月,OpenAI 在智能体领域「开大」了。 今天,OpenAI 正在为 ChatGPT 推出一项名为「Tasks」的新测试功能,该功能允许用户安排未来的行动和提醒事项。
1/15/2025 11:04:00 AM
机器之心
会捡垃圾、能干家务,元萝卜“视觉+机械臂”技术扫地机器人应用首秀
在2025开年科技盛宴CES(国际消费电子展)上,AI机器人无疑成为全场焦点,而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用,更获得了全球媒体的高度关注。 通过将视觉感知与机械臂技术相结合,能够自主完成拾取垃圾入桶等任务,不仅展示了家用机器人发展的未来形态,也让大众看到了具身智能机器人融入家庭生活的广阔前景。 随着大模型技术和具身智能浪潮汹涌而至,家用机器人正迎来全新发展机遇,中国企业的创新力也愈发凸显。
1/15/2025 10:59:00 AM
新闻助手
快手可灵凭什么频繁刷屏?揭秘背后三项重要研究
“可灵(KLING)”,近半年来频繁亮相于国内外各大科技媒体,已然成为科技感与创意的代名词,它代表了快手 AI 团队在视频生成领域的前沿探索。 作为全球首个可公开体验的真实影像级视频生成大模型,可灵于 2024 年 6 月 6 日正式发布并上线。 在短短半年多的时间里,可灵已完成了数十次功能与效果的升级迭代,始终稳居全球视频生成领域的第一梯队,持续引领着行业效果的提升。
1/15/2025 10:57:00 AM
机器之心
OpenAI o1 推理过程出现中文,专家解读 AI 可能只想用最高效的语言来思考
科技媒体 TechCrunch 昨日(1 月 14 日)发布博文,报道称 OpenAI 最新推理模型 o1 在推理过程中,会使用中文、波斯语等多种语言“思考”,引发了 AI 界的关注和猜测。
1/15/2025 10:39:43 AM
故渊
国内首个端到端语音同传:星火语音同传大模型发布,达到人类专家译员水平
官方演示了通过翻译机进行语音同声传译,可以看到一些专有词汇也能正常翻译。科大讯飞官方还透露,将在 2025 年发布更多翻译机新品。
1/15/2025 10:20:08 AM
汪淼
讯飞星火 4.0 Turbo 底座升级:首发混域知识搜索技术,七大能力全面提升
讯飞星火 4.0 Turbo 在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面全面提升,并且图文识别能力迎来升级,倾斜少线表格也能够正常识别。
1/15/2025 10:15:47 AM
汪淼
讯飞星火深度推理模型 X1 发布:唯一全国产算力训练,多项指标国内第一
科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型 —— 讯飞星火深度推理模型 X1。
1/15/2025 10:09:45 AM
汪淼
多模态 AI 助力癌症治疗,更准确预测癌症复发概率,生存率等
Nature:斯坦福大学医学院设计的独特人工智能可以预测癌症预后和治疗反应
来自斯坦福医学院的科研团队研发了名为 MUSK 的 AI 模型,结合医学图像和文本数据,可以精准预测癌症患者的预后和治疗反应。
IT之家注:预后(英语:Prognosis)是一个医学名词,是指基于病人当前的状况,结合疾病的了解,例如临床表现、化验结果、影像学检查、病因、病理、病情规律等,以及治疗时机、方法和过程中出现的新情况,来推估治疗后的可能结果。
MUSK 模型的亮点在于,突破性地整合了视觉数据(如病理图像)和文本数据(如病历和临床记录),可以更全面理解患者病情。
MUSK 模型在庞大的非配对多模态数据集上进行预训练,极大地扩展了其学习范围,使其比传统AI模型更具适应性和定制化能力。
该模型通过 5000万张病理图像和超过10亿条医学文本训练,可以准确预测16种癌症类型的患者生存率和治疗反应。
MUSK模型能够分析包括患者人口统计学信息和病史在内数千个数据点,更准确地确定哪些疗法(例如免疫疗法)对个体患者最有效。
该团队表示相比传统方法,其预测生存率的准确性提高了11个百分点,达到75%;预测免疫治疗适用性的准确性从61%提升至77%;预测五年内黑色素瘤复发风险的准确性则提高了12 个百分点,达到83%。
来自斯坦福医学院的科研团队研发了名为 MUSK 的 AI 模型,结合医学图像和文本数据,可以精准预测癌症患者的预后和治疗反应。
1/15/2025 9:54:43 AM
故渊
全球首个人形机器人马拉松比赛拟于今年 4 月在北京亦庄举办
2025 年北京两会公布,今年北京市将举办世界人形机器人“一会一赛”。“一会”是指世界人形机器人运动会,“一赛”是指机器人半程马拉松比赛,前者拟于今年 8 月举办、后者拟于 4 月举行。
1/15/2025 9:43:25 AM
归泷(实习)
小米澎湃 OS 2「超级小爱」升级计划公布,覆盖超 25 款机型
小米公司官方今日发文宣布,澎湃 OS 2「超级小爱」已向正式版用户开放,其支持手势唤醒、智能理解屏幕内容等能力。
1/15/2025 9:29:03 AM
归泷(实习)
ChatGPT 变身 AI 私人助理:新 Tasks 定时播报全网热点、设置每日学习 / 健身计划
OpenAI 公司今天在 X 平台发布推文,宣布以测试版形式,为 ChatGPT 聊天机器人引入“Tasks”(任务)功能,支持用户设置提醒事项。
1/15/2025 8:44:26 AM
故渊
资讯热榜
标签云
人工智能
OpenAI
AI
AIGC
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind