应用
商汤大模型的「5o」交互,普通人如何和 AI 过一天?
在商汤的演示下,日日新5o拥有像人一样的实时视觉能力,可以跟人进行流畅的视频交互——能听、能说、能看、无延时,它可以通过摄像头 语音实现和用户的实时交互,并获知用户所在的真实场景下的各种状态信息,打破了与AI交互的次元壁,实现了与AI的“视频通话”,已经具备真人聊天般的交互体验。 两个月前OpenAI推出了GPT-4o,以突破性的智能交互能力,彻底颠覆了我们对AI语音助手的认知,颠覆了过去的人机交互,给业界带来又一次震撼。 震撼之外,中国大模型界对GPT-4o的认知似乎并不如GPT-4那么统一,有人认为「在实现AGI的路上,GPT-4o并不重要」、有人评价「在技术突破上,GPT-4o没那么惊艳」;有人认为GPT-4o的发布是 AI 2.0 时代的标志性事件,会催生全新的应用平台和商业模式。
7/15/2024 6:42:00 PM
张进
百度推出仿真人 AI 社交 App“文小言”:可与虚拟角色互动并建立情感连接
据 Tech 星球上周末报道,百度近期上线了一款名为“文小言”的 AI 数字人社交 App,其基于文心大模型技术打造,是一款与 AI 虚拟角色进行实时沟通、互动并建立情感连接的人工智能应用服务。根据该媒体发布的使用体验来看,该 App 在玩法和功能上相比同类型 AI 聊天产品无较大区别,但由于采用仿真的数字人作为“AI 社交对象”,因此交互“更具真实感”。同时,该 App 内置的数字人在肢体语言动作上仍稍显不流畅。此外,该 App 不支持创建专属的数字人。用户可在该 App 的“发现”功能栏内寻找所需的数字人聊天对
7/15/2024 6:19:20 PM
清源
传 4050 亿参数版 Llama3 将在 23 日发布;机械臂公司获 6300 万美元融资丨AI情报局
今日融资快报机械臂公司 Standard Bots 获 6300 万美元融资,亚马逊、三星等参投Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司,该公司已获得 6300 万美元的 B 轮新资金。 本轮融资由 General Catalyst 领投,亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。
7/15/2024 6:09:00 PM
我在思考中
谷歌 Gemini 被曝今日起推出多项新功能:定制 GPT、记忆或个性化回复等
根据反向工程师 @testingcatalog 的发现,谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看,这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送,但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日(AI在线注:日期即今日,但以具体时区为准),预计当天将带来 1 项功能。而在 7 月 18 日,谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能,但未说明这些功能的具体上线日期。文生图工具 I
7/15/2024 6:02:35 PM
清源
AI告别鬼画符!快手可图和国外写字小能手Ideogram打擂台,谁更牛?
机器之能报道编辑:杨文快手AI,步履不停。最近,快手出尽风头。OpenAI 当家花旦 Sora 的公测还遥遥无期,快手就率先祭出了可灵。凭借其逼真、高清、不输 Sora 的视觉效果,一下子成了全球网友的新宠。据快手称,可灵申请用户数量已经接近 70 万,目前已开放给超 30 万用户使用。趁着热乎劲,快手又马不停蹄地上线了可灵网页版。老铁们拿它各种整活儿 ——蒙娜丽莎戴墨镜:容嬷嬷喂紫薇吃鸡腿:大胖橘端着高脚杯、翘着兰花指喝红酒:甚至还给肯德基来了一波广告植入:不过呢,今天我们不聊可灵,而是唠唠快手的另一款明星产品
7/15/2024 5:34:00 PM
机器之能
谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档
感谢据 X 用户 @Kevin Bankston 的报告,谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到,Bankston 在其推文中详细描述了这一问题。最初,他发现 Gemini 似乎在阅读他的 Google Drive 文档,但相关设置中找不到禁用该功能的选项。经进一步调查,他发现这是 Google Drive 本身的问题,而非 Google Docs,但两者可能都存在类似的漏洞。而且,根据 Gemini 人工智能的说法,用于控
7/15/2024 5:09:08 PM
远洋
研究:AI 测谎能力比人类更强,但会对社会交往造成影响
德国维尔茨堡大学当地时间 12 日公布的最新研究显示,在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代,人工智能在测谎方面的表现比人类更佳。图源 Pixabay来自维尔茨堡、杜伊斯堡、柏林和图卢兹的研究人员探讨了 AI 在检测谎言方面的有效性及其对人类行为的影响。这项研究的主要发现可以总结如下:在基于文本的谎言检测中,AI 的准确性优于人类。没有 AI 的支持,人们不愿指责他人撒谎。在 AI 的支持下,人们更有可能表达对遇到谎言的怀疑。只有大约三分之一的研究参与者会利用向 AI 询问评估的机会。然而,大多数人
7/15/2024 4:51:59 PM
清源
全国高校首个,山东财经大学发布新文科教育教学专有大模型“AI 才”
AI在线从山东财经大学获悉,7 月 11 日,该校发布了全国高校首个新文科教育教学专有大模型 ——“AI 才”教育教学专有大模型,该模型由学校与百度智能云、山东银瑞科技合作共同开发。据介绍,该大模型可通过大数据、机器学习、知识图谱等关键技术,搭建智能科教环境,打造具有专业性、个性化、系统性、一站式特点,集“知”“教”“学”“研”“训”“智”为一体的教学科研服务平台。该大模型具备如下功能及特性:“知识数字化”板块:可在大模型平台上进行专业教材、科研数据、实习实训案例等知识的规范化、结构化梳理和沉淀,形成自有知识库,实
7/15/2024 3:48:09 PM
清源
“知乎AI先行者沙龙”深圳站:探航大模型应用新风口
7月14日,第三届“知乎AI先行者沙龙”在深圳举行。 知乎邀请众多AI行业从业者、专家、学者齐聚一堂,用最前沿的观点和最专业的思考,共同探讨大模型应用的新风口。 本届沙龙以“探航”为主题,知乎高级副总裁、社区业务负责人张荣乐出席活动并致辞,香港大学计算与数据科学学院院长马毅、RWKV元始智能联合创始人罗璇、粤港澳大湾区数字经济研究院基础软件中心首席科学家张宏波、OPPO AI 中心技术战略规划总监陈晓春,分别围绕人工智能的本质、端侧模型与硬件的结合等议题进行主题演讲。
7/15/2024 3:35:00 PM
朱可轩
阿里妈妈给出了什么样的赛题,被顶会NeurIPS 2024 pick了?
会「出价」也是个很实用的技能。在众多人工智能顶会中,NeurIPS 属于什么段位?有人将其代入《甄嬛传》宇宙做了张图:大概配享「后位」。 图源:小红书用户 @云卷月舒这一排名可能存在争议,但毋庸置疑的是,NeurIPS 在 AI 顶会中始终稳居前三,并且长期处于 Google Scholar 全球所有学科期刊、顶会的前十名。因此,能够在这一会议中发表论文是众多 AI 研究者的共同目标。开创性的 Al
7/15/2024 3:15:00 PM
机器之心
赶时髦的 AIGC 营销人,如何实现「里子」与「面子」的双赢?
过去一年,AI 在各行各业掀起了一场技术变革狂潮。向来「赶时髦」的营销圈,更是率先拥抱 AIGC 技术。相关数据显示,2023年,我国已有近半数广告主企业在线上营销活动中应用 AIGC 技术,其中超过 90% 的应用聚焦于内容创作和创意开发。这种由技术驱动的广告营销新模式正在逐渐成型,为广告主降本增效带来更多可能。然而,AIGC 技术在营销领域大施拳脚的同时,也伴随着诸多挑战。例如,AIGC 技术在生成营销素材时可能会产生内容风险,重金投入的营销活动一不小心为黑产做了嫁衣……那么,AIGC 营销人该如何平衡创作内容
7/15/2024 3:04:00 PM
机器之心
微软开源的GraphRAG爆火,Github Star量破万,生成式AI进入知识图谱时代?
知识图谱从不退环境!LLM 很强大,但也存在一些明显缺点,比如幻觉问题、可解释性差、抓不住问题重点、隐私和安全问题等。检索增强式生成(RAG)可大幅提升 LLM 的生成质量和结果有用性。本月初,微软发布最强 RAG 知识库开源方案 GraphRAG,项目上线即爆火,现在星标量已经达到 10.5 k。项目地址::,它比普通的 RAG 更强大:GraphRAG 使用 LLM 生成知识图谱,在对复杂信息进行文档分析时可显著提高问答性能,尤其是在处理私有数据时。
7/15/2024 2:57:00 PM
机器之心
MotionClone:无需训练,一键克隆视频运动
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。论文::: MotionClone 的新框架,给定任意的参考视频,能够在不进
7/15/2024 2:37:00 PM
机器之心
谷歌 DeepMind 被曝抄袭开源成果,论文还中了顶流会议
大模型圈再曝抄袭大瓜,这回,“被告”还是大名鼎鼎的谷歌 DeepMind。“原告”直接怒喷:他们就是把我们的技术报告洗了一遍!具体是这么个事儿:谷歌 DeepMind 一篇中了顶流新生代会议 CoLM 2024 的论文被挂了,瓜主直指其抄袭了一年前就挂在 arXiv 上的一项研究。开源的那种。两篇论文探讨的都是一种规范模型文本生成结构的方法。抓马的是,谷歌 DeepMind 这篇论文中确实明晃晃写着引用了“原告”的论文。然鹅,即便是标明了引用,“原告”的两位论文作者 Brandon T. Willard(布兰登)和
7/15/2024 2:06:20 PM
汪淼
直击真实的甲方AGI需求,人工智能赋能产业融通发展论坛顺利召开
7月6日,「2024 WAIC 人工智能赋能产业融通发展论坛」在世博展览馆隆重举行。本次论坛主要议题为探讨人工智能赋能新型工业化、促进产业融通发展的相关问题,包括领导致辞、签约仪式、主题演讲、央国企人工智能场景需求发布和圆桌论坛等多个环节。众多来自央国企机构和人工智能领域的企业参与,包括中国电子信息产业发展研究院、中国移动研究院、中国石化胜利油田、国家电网客服中心、中电昱创、南方电网数字电网集团、达摩院、百度智能云、创新奇智等。出席嘉宾围绕人工智能在不同领域的应用实践、大模型的发展与应用、智能化运维、人工智能赋能产
7/15/2024 11:55:00 AM
机器之心
非法阻止员工披露AI安全风险,OpenAI严厉「封口协议」再遭举报
OpenAI 在人工智能领域的领头羊地位家喻户晓。其产品聊天机器人 ChatGPT 系列、文生图 DALL・E 系列、文生视频 Sora 等都被誉为生产力提升的超强助手据透露,OpenAI 内部正在一个代号为「草莓(Strawberry)」的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过,而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。不过 OpenAI 现在似乎正陷在另一场风波当中。据《华盛顿邮报》报道,一位举报人向美国证券交易委员会(SCE,Securities and Exch
7/15/2024 11:52:00 AM
机器之心
7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文主要作者来自 LMMs-Lab 团队与新加坡南洋理工大学。共同一作中,张培源是南洋理工大学研究助理,张恺宸是南洋理工大学四年级本科生,李博为南洋理工大学三年级博士生,指导教师为 MML
7/15/2024 11:44:00 AM
机器之心
大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?
AI 视频圈正杀得你死我活。前脚快手高调发布可灵,后脚 Luma 不甘示弱,推出最新视频模型 Dream Machine,紧接着 Runway 横插一脚,祭出 Gen-3 这个大杀器。在微妙的 FOMO 气氛带动下,更多玩家秉持着「累死自己,卷死同行」的宗旨,一头扎进这个赛道 ——阿里巴巴达摩院押注「寻光视频创作平台」、字节即梦 AI 探索「生成式影剧」、美图 MOKI 盯上 AI 短片创作、Haiper AI 则聚焦创意表达 ……7 月 5 日的上海,火热,像极了 AI 视频圈的焦灼。这一天,上海世博展览馆 H3
7/15/2024 11:40:00 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind