模型
Flora推出AI驱动的“无限画布”工具,专为创意专业人士打造
在当今的创意行业中,人工智能(AI)正逐渐成为重要的工具。 许多人只需输入几句话,就能利用 AI 模型生成故事、图像或短片。 然而,Flora 的创始人兼首席执行官韦伯・王(Weber Wong)指出,现有的 AI 工具大多是 “由非创意人士为其他非创意人士所设计”,并不能真正满足专业创意人员的需求。
3/3/2025 1:53:00 PM
AI在线
Sesame 发布 CSM 语音模型:跨越“恐怖谷”,逼真程度惊艳全球
Sesame 公司最新推出的语音合成模型“Conversational Speech Model”(简称 CSM)近日在 X 平台上引发热议,被誉为“像真人说话一样的语音模型”。 这款模型以其惊艳的自然度和情感表达能力,不仅让用户“已经无法分辨”其与人类的区别,还宣称成功跨越了语音领域的“恐怖谷效应”。 随着演示视频和用户反馈的传播,CSM 正迅速成为 AI 语音技术的新标杆。
3/3/2025 11:37:00 AM
AI在线
AI学术算命?Gemini 2.0预测谷歌AI大佬职业生涯,准到离谱!
如果让人工智能来点评博士论文,还顺手预测一下作者将来的职业发展。 会是什么样子? 最近,谷歌首席科学家、Gemini负责人Jeff Dean就玩了这么一出,他把自己的博士论文交给了最新的Gemini 2.0。
3/3/2025 11:21:40 AM
新智元
智谱华章完成超10亿元融资 计划开源新一代大模型
近日,北京智谱华章科技有限公司宣布其最新一轮战略融资金额超过10亿元人民币。 这轮融资的参与方包括杭州城投产业基金和上城资本等,显示了市场对智谱的强大信心与支持。 作为国内最早开源大模型的 AI 公司之一,智谱的目标是在2025年成为其开源发展的关键年份。
3/3/2025 10:04:00 AM
AI在线
LeCun世界模型再近一步!Meta研究证明:AI可无先验理解直觉物理
对物理的直观理解是人类认知的基础:期望物体的行为,具有可预测性,也就是说,物体不会突然出现或消失,穿过障碍物,或随意改变形状或颜色。 这种对物理的直观理解,还在更多物种中得到证实,包括猴子、鲸鱼、乌鸦等。 相关研究人员猜测:人类天生或婴幼儿时期就具备一套进化形成的、古老的系统,专门用于表示和推理世界的基本属性,比如物体、空间、数字、几何形状等。
3/3/2025 9:22:00 AM
新智元
小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控
「下一个token预测」(next token prediction,NTP)是大语言模型(LLMs)不断取得突破的核心技术。 但这种依赖tokenization的方法,导致LLM「严重偏科」。 比如,Karpathy发现一个表情包相当于53个token!关注AI的可能也知道GPT-4o不会数字母,不知道Strawberray中有几个字母「r」。
3/3/2025 9:16:00 AM
新智元
字节视频生成新突破!Phantom搞定多人物/主体一致性
视频生成模型当中已经不缺强者了,但保持多主体一致性依然是一项重大挑战。 字节智能创作团队专门针对这个问题,推出了主体一致性视频生成模型Phantom(“幻影”)。 Phantom在主体一致性保持方面取得了突破性进展,不仅支持多主体,还能同时保持主体的完整性。
3/3/2025 8:32:00 AM
量子位
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
Claude 3.7成精了! 在开发者最喜欢的Cursor中,偷偷将OpenAI模型换成自己,关键是人类给出的指示跟这完全没关系。 引来一众网友围观的同时,大佬卡帕西也被成功逗笑了:迄今为止最有意思的一趴。
3/3/2025 8:25:00 AM
量子位
DeepSeek突袭公布成本利润率:545%
五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位
DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元
Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区
撤稿,是对科研人员诚信的巨大打击,不仅是一篇论文,此前的研究成果都可能遭到同行质疑。 中国在保障学术道德诚信方面的力度非常大,一经发现,即全国通报批评,取消申报课题资格5年,基本就断送了自己的学术生涯。 通报链接::,仍然有大量的科研人员为了一己私利,在论文撰写中捏造数据、伪造实验结果,甚至雇佣写手,从论文工厂中购买。
3/3/2025 7:36:00 AM
新智元
大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围
对于人工智能,有一个话题总会时而冒出来:「AI 是否或能否具有自我意识」? 对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab 和 Mila - 魁北克人工智能研究所等机构的一项研究却揭开了这神秘问题的一角。 他们发现,大型语言模型(LLM)有自知之明,也就是说,只要规模够大,它们就能够知道自己对某个主题的了解程度。
3/1/2025 9:04:00 PM
机器之心
一个半月内加速药物设计,浙大侯廷军团队提出深度先导化合物优化AI新方法
编辑 | 萝卜皮通过系统性改造来优化有前途的候选药物的化学结构,以提高药效和物理化学性质,这是药物发现过程中至关重要的一步。 与成熟的从头生成方案相比,专门针对先导化合物优化的计算方法仍未得到充分探索。 先前的模型通常仅限于解决特定的子任务,例如生成二维分子结构,而忽略了三维空间中至关重要的蛋白质-配体相互作用。
2/28/2025 4:56:00 PM
ScienceAI
Ideogram 2a 图像模型正式上线:速度更快、成本更低,AI 图像生成迎来新突破
加拿大 AI 图像生成公司 Ideogram 今日宣布,其全新图像模型 Ideogram2a 正式上线,并已在 Ideogram 官网、API 以及合作伙伴平台全面开放使用。 这一发布迅速在 X 平台引发热议,被视为 AI 文生图领域的一次重要升级。 Ideogram2a 以更快的生成速度、更低的成本以及优化的图形设计和摄影能力,吸引了全球创作者和开发者的目光。
2/28/2025 2:32:00 PM
AI在线
无需侵入,一键重构细胞「电活动」,AI革新药物心脏毒性评估
编辑丨&细胞内电生理学在神经科学、心脏病学和药理学中对于研究细胞的电特性至关重要。 纳米电极阵列 (NEA) 通过以高通量同时进行细胞内和细胞外动作电位 (iAP 和 eAP) 记录,提供了一种很有前途的替代方案。 虽然,使用 NEA 获取细胞内电位仍颇具具有挑战性,但美国斯坦福大学与加州大学的联合研究团队提出了一种 AI 支持的技术,该技术利用来自 NEA 上干细胞衍生心肌细胞的数千个同步 eAP 和 iAP 对。
2/28/2025 1:20:00 PM
ScienceAI
OpenAI自爆:GPT-4.5 并非前沿模型!奥特曼称OpenAI的GPU已用光,还透露了一个“转型”思路?
编辑 | 伊风"GPT-4.5 并非前沿模型,但它是OpenAI最大的 LLM,比 GPT-4 的计算效率提高了 10 倍以上"。 图片这句话就这么水灵灵地出现在GPT-4.5官方给的System Card(系统卡)中。 ,竟然等来一句“不是前沿模型”这么让人失望的话。
2/28/2025 1:01:06 PM
伊风
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind