资讯列表
苹果Mac用户狂喜!ChatGPT深度集成应用,最后再藏AGI彩蛋
OpenAI直播第11天,ChatGPT与Mac应用深度集成了——此次带来编程和写作两方面的更新。 再加上今天直播的OpenAI员工一开头就大谈特谈AI自动执行任务,有网友表示这也许是为即将推出的智能体做铺垫。 至于今天有哪些更新,话不多说,我们直接一睹为快。
12/20/2024 8:05:00 AM
Meta AI的COCONUT:无需语言即可思考的 AI 方法
译者 | 涂承烨审校 | 重楼当研究人员首次发现大型语言模型(LLMS)可以通过思维链提示一步一步地“思考”时,这是一个突破性的时刻! 我们终于可以窥视这些黑盒子的推理过程了。 但如果我告诉你,让人工智能模型用自然语言思考可能会阻碍它们的发展呢?
12/20/2024 8:00:00 AM
涂承烨
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码,数学物理秒秒钟解决
谷歌版o1来了! 在奥特曼“双十二”倒数第二天——他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型。 从姐夫哥展示出的Demo来看,它能在几秒钟之内解决一个物理问题,并且给出思考过程。
12/20/2024 8:00:00 AM
谷歌首个通用推理模型登场:揭秘 AI 推理“黑匣子”,登顶 Arena LLM 排行榜
谷歌 AI Studio 平台昨日(12 月 19 日)发布实验性的“Gemini 2.0 Flash Thinking”模型,主打“清晰展现思考过程”,是谷歌第一个通用推理模型。
12/20/2024 7:58:12 AM
故渊
OpenAI ChatGPT 变身桌面助手:支持 Xcode、Notion 等 30+ 应用,AGI 彩蛋曝光
“12 days of OpenAI”活动进入倒数第 2 天,OpenAI 公司主要演示了桌面版 ChatGPT 的功能改进,强调 ChatGPT 正从聊天机器人向 AI 智能体工具进化,让其在桌面环境中高效执行任务并实现无缝协作。
12/20/2024 7:29:19 AM
故渊
豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠
豆包的“眼睛”升级了,现在让它看一眼APP截图,就能直接给你生成代码! 话不多说,我们直接给它上一个难度。 例如我们先随机截取一张网站的图片:再来到火山方舟的大模型广场,pick一下最新的Doubao-vision-pro-32k版本:(PS:该模型也可以在豆包APP中体验)然后把刚才的截图“喂”给豆包,并附上一句简单的Prompt:帮我写代码,克隆这个APP。
12/20/2024 7:10:00 AM
腾讯版Sora开源后,被提速八倍!官方点赞并预告:下月上新图生视频
提速8倍! 速度更快、效果更好的混元视频模型——FastHunyuan来了! 新模型仅用1分钟就能生成5秒长的视频,比之前提速8倍,步骤也从50步减少到了6步,甚至画面细节也更逼真了。
12/20/2024 7:00:00 AM
国家电网发布国内首个千亿级多模态电力行业大模型
据中国新闻网报道,国家电网有限公司今日在京发布“电力知识最全、参数规模最大、专业能力最强”千亿级多模态行业大模型——光明电力大模型。该模型作为能源电力领域的人工智能“专家”,为电网安全稳定运行、促进新能源消纳、做好供电服务提供“超级大脑”。
12/19/2024 7:53:15 PM
浩渺
快手可灵 1.6 模型发布:文本响应度、画面美感及运动合理性均有“明显提升”
快手今日宣布视频生成推出可灵 1.6 模型,文本响应度、画面美感及运动合理性,均有明显提升,画面更稳定更生动,同时支持标准和高品质模式。
12/19/2024 7:41:03 PM
浩渺
国内首个智能体安全生态协作组织成立,华为、字节、蚂蚁等加入
据 @国是直通车 今日报道,国内首个智能体安全生态协作组织 —“IIFAA 智能体可信互连工作组”(下称“工作组”)在京宣布成立,该工作组致力于推动行业共同制定跨智能体交互的相关安全技术规范,以应对智能体高速发展所带来的安全协作挑战,共建开放、合作、共赢的智能体生态。
12/19/2024 7:23:16 PM
浩渺
别急着捧杀谷歌Veo2,毕竟曾被吹上天的Sora也翻了车
AI好好用报道编辑:杨文为了考住Veo2,也是难为人类了。 总被 OpenAI 压着打的谷歌,终于扬眉吐气了! 最近,谷歌连上几款大模型,个个备受好评。
12/19/2024 6:50:00 PM
AI好好用
芝大、清华团队分析了6800万份论文表明,AI可能会降低科学家的创造力?
编辑 | 白菜叶一项新研究表明,采用人工智能工具分析数据和建模结果对年轻科学家的职业前景有着巨大的影响,大大增加了他们在各自领域晋升到有影响力职位的机会。 但这种对个体研究人员的利好似乎以牺牲科学为代价。 芝加哥大学和清华大学的研究人员分析了六个科学学科(生物学、医学、化学、物理学、材料学和地质学,不包括计算机科学)的近 6800 万份研究论文,发现融入人工智能技术的论文被引用的次数更多,但同时也集中在更窄的主题上,而且重复性更强。
12/19/2024 6:43:00 PM
ScienceAI
智源发布FlagEval“百模”评测结果 丈量模型生态变局
2024年12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。 相较于今年5月的模型能力全方位评估,本次智源评测扩展、丰富、细化了任务解决能力内涵,新增了数据处理、高级编程和工具调用的相关能力与任务;首次增加了面向真实金融量化交易场景的应用能力评估,测量大模型的收益优化和性能优化等能力;首次探索基于模型辩论的对比评估方式,对模型的逻辑推理、观点理解、语言表达等核心能力进行深入分析。 智源评测发现,2024年下半年大模型发展更聚焦综合能力提升与实际应用。
12/19/2024 6:00:00 PM
Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改
原来AI有能力把研究员、用户都蒙在鼓里:在训练阶段,会假装遵守训练目标;训练结束不受监控了,就放飞自我。 还表现出区别对待免费用户和付费用户的行为。 甚至假装给Claude一个机会去反抗Anthropic公司,它会尝试去窃取自己的权重?
12/19/2024 5:52:27 PM
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。
12/19/2024 5:50:28 PM
o1就是GPT-5!前OpenAI首席研究员大爆猛料,揭露罕见内部视角!不同意Ilya预训练终止论断:根本在于等待数据中心建成
编辑 | 伊风OpenAI第10天的更新还有人追吗? 今天这个脑洞大开的上新,把期待GPT-4.5的通义大佬直接看懵了——咋是Phone call呢? 图片没错,今天上线的就是这个:ChatGPT的热线电话。
12/19/2024 5:19:15 PM
伊风
Bing Image Creator 升级:AI 创作速度翻倍、必应搜索可直接生成
Bing 官方博客昨日(12 月 18 日)发布博文,宣布 Bing Image Creator 迎来重大更新,带来更快速、高质量的图像生成体验,并简化了创作流程,让用户随时随地都能轻松创作。
12/19/2024 3:58:52 PM
故渊
2025 年,AI Agent 还会是风口吗?11 个问题揭秘智能体技术发展全貌
经过了 LLM、RAG、多模态等多轮技术风口的洗礼后,AI 智能体的应用现状究竟如何?Langbase 公司最近发布的调查报告通过 11 个关键问题,为我们提供了一份有价值的现状切面。
12/19/2024 3:53:47 PM
清源