应用

日本初创公司 Carelogy 推出养宠 App：借助 AI 帮主人识别爱猫是否感觉疼痛

据路透社今日报道，日本一初创公司 Carelogy 和日本大学（Nihon University）共同开发了一款名为“CatsMe!”的 App，通过训练识别 6000 张猫咪图片，自去年发布以来已有超过 23 万用户。这款 App 可以判断猫咪何时感到疼痛，从而减少了用户推测何时需要带猫咪去宠物医院所承受压力的次数。开发者表示，这款应用的准确率超过 95%，随着 AI 识别更多猫咪面孔，其准确率还有望进一步提高。据日本大学教授江田和也（Kazuya Edamura）介绍，兽医可以在一定程度上判断动物是否处于疼痛状

6/13/2024 12:43:23 PM 清源

快手「可灵」爆火：海外AI圈巨震，中国版Sora一号难求

短短一年后，AI 生成的「吃面条」已经如此自然流畅？这让全球网友都感受到了亿点点震撼。图源：，都来自快手刚刚推出的文生视频大模型「可灵」（Kling）。不是预发布、不是纯 Demo 合集，而是直接开放测试的产品级应用，人人都能申请。而且，可灵支持生成最长 2 分钟、30fps 的 1080P 视频，主打从头脑风暴到可发布作品的「一键转化」。（官网地址：）最早一批用上的用户已经「真香」：图源：

6/13/2024 11:28:00 AM 机器之心

美图影像节：聚焦AI工作流，6款新品赋能影像设计行业

6月12日，美图公司举办以"聊聊AI工作流"为主题的第三届美图影像节，现场发布6款产品：美图云修V2、开拍V2、美图设计室V3、站酷设计服务、奇觅、MOKI，覆盖商业摄影、口播视频、电商设计、设计服务、游戏营销、视频生成等多个领域。这些产品主要围绕AI工作流，通过创新技术改进各种行业操作，提高效率并简化用户体验。美图公司创始人、董事长兼首席执行官吴欣鸿表示，AI工作流正在颠覆传统工作流，尤其是美图所处的影像与设计行业，AI是推动创新和提升效率的重要力量。

6/13/2024 11:18:00 AM 朱家峻

苹果智能背后模型公布：3B模型优于Gemma-7B，服务器模型媲美GPT-3.5-Turbo

在刚刚结束的全球开发者大会上，苹果宣布了 Apple intelligence，这是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新个性化智能系统。 Apple Intelligence 由多种高度智能的生成模型组成，这些模型专为用户的日常任务设计。在苹果刚刚更新的博客中，他们详细介绍了其中两款模型：一个拥有约 30 亿参数的设备端语言模型；一个更大的基于服务器的语言模型，该模型通过私有云计算在苹果服务器上运行。这两个基础模型是苹果生成模型家族的一部分，苹果表示，他们会在不

6/13/2024 11:16:00 AM 机器之心

120 秒生成 120 帧，视频模型 Dream Machine 开放测试免费试用

Luma AI 在 X 平台宣布，视频模型 Dream Machine 开放测试，可进行免费试用。IT之家附 Dream Machine 地址： AI 称 Dream Machine 可以从文本和图像生成“高质量”的视频。Dream Machine 可在 120 秒生成 120 帧，目前单个视频最长为 5 秒；生成的视频具有逼真的流畅运动、电影摄影和戏剧效果；还可以匹配摄像机运动，创造出“惊艳”的画面。Luma AI 也提到了目前模型存在的问题，比如切换视角时汽车会变形，狗的运动没有用到爪子，显示文字会有问题（将

6/13/2024 11:04:22 AM 沛霖（实习）

打通智能体「自我进化」全流程！复旦推出通用智能体平台AgentGym

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]通用智能体的自我进化能力，并非遥不可及。LLM-based Agent，已经不再需要人类监督者的帮助，开始实现「自我进化」！这个智能体在学习了专家轨迹以后，获得了基础的通用能力，能够在

6/13/2024 10:54:00 AM 机器之心

“小爱同学”接入字节跳动豆包大模型，小米 SU7 已搭载

IT之家从火山引擎官方公众号获悉，小米旗下人工智能助手“小爱同学”与火山引擎达成合作，双方基于豆包大模型为用户带来更智能的 AI 交互体验。据介绍，“小爱同学”作为小米公司的智能助手，已经成功融入手机、智能家居、智能穿戴设备以及小米 SU7 等众多小米产品中，提升了用户的日常交互便捷性。全新的“小爱同学”不仅更加精准地把握用户需求，还以更快的响应速度和更全面的内容服务。例如，当用户询问复杂的科学概念时，“小爱同学”能够精准捕捉需求，即时提供精确、专业的解答，同时严格遵循道德和法律准则，确保内容健康、安全，不涉及不良

6/13/2024 10:29:37 AM 远洋

历时约半年，消息称 OpenAI 年化营收翻倍至 34 亿美元

感谢据 The Information 今日凌晨援引不具名人士消息称，OpenAI 首席执行官山姆・阿尔特曼对员工表示，在过去约六个月的时间里，公司年化营收达到了 34 亿美元（IT之家备注：当前约 246.99 亿元人民币），相比去年年底翻了一番。阿尔特曼还提到，OpenAI 通过微软 Azure 提供人工智能模型接入，也有望获得约 2 亿美元（当前约 14.53 亿元人民币）的营收。据悉，OpenAI 在 2023 年底时的年化营收还只有 16 亿美元（当前约 116.23 亿元人民币），去年夏天时约为 10

6/13/2024 8:16:39 AM 清源

Midjourney 支持个性化微调啦！一文详解新功能 Personalization

大家好，这里是和你们一起探索 AI 的花生~ 很久没有写 Midjourney 的更新介绍了，因为它在二三月份接连推出 style reference 风格参考、character reference 角色参考后一直都没有大的更新。不过昨天官方接连发布了 2 条更新内容，分别是官网的新优化和新参数 Personalization 的推出，今天就用一篇文章为大家介绍一下 Midjourney 近期的更新。上期回顾：一、Alpha 网站优化官网直达： Midjourney 的 Alpha 官网现在基本全面开放了（

6/13/2024 7:37:33 AM 夏花生

辰韬资本联合三方重磅发布《端到端自动驾驶行业研究报告》

自动驾驶技术的演进随着 AI 和大模型技术的发展进入全新阶段，“端到端自动驾驶”作为其中最重要的一项技术演进趋势近来成为自动驾驶行业关注的焦点。在端到端自动驾驶领域，无论是产业界、学术界和资本市场，里程碑事件都有发生，各大龙头企业也纷纷布局这一核心关键技术路线。2024年6月12日，辰韬资本联合南京大学上海校友会自动驾驶分会、九章智驾、宝通科技共同主办，招商银行、云道资本协办的“端到端引领自动驾驶新时代高峰论坛暨行业研究报告发布会”活动在上海成功举办。200多位产业专家、投资机构、研究机构及智能驾驶头部企业的代表共

6/12/2024 6:21:00 PM 新闻助手

AI 在用 | 免费！Adobe一分钟生成火柴人搞笑动画，视频、配音一锅出

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。视频链接：：抖音博主「英英漫」视频链接：：抖音博主「英英漫」大家是不是还在纳闷，这类视频到底是咋个搞出来滴？巧了，最近，小编捡到一个好东西 ——Adobe Express。这是 Adobe 公司推出的一款在线图形设计工具，它允许用

6/12/2024 6:02:00 PM 机器之能

「思谋科技」获香港投资管理集团首笔投资，香港政府AI战略正式拉开

6月12日，香港投资管理有限公司（下称：港投公司）与思谋科技共同举办战略合作协议签约仪式。此次签约仪式得到了香港特区政府的高度重视，香港特别行政区行政长官李家超透过视频致辞，香港特别行政区政府财政司司长陈茂波到场见证签约并在午餐会发表主旨演讲。各界对港投公司与思谋科技在人工智能前沿科技产业化落地的合作，包括在粤港澳大湾区更广泛应用，助力区域经济的数字化、智能化转型等发展，寄予厚望。香港投资管理有限公司行政总裁陈家齐（左）与思谋科技创始人兼董事长贾佳亚（右）签署战略合作协议，并由香港特别行政区政府财政司司长陈茂波（中

6/12/2024 5:05:00 PM 机器之心

港投公司与「港产独角兽」思谋科技今签定战略合作协议

（香港，6月12日）香港投资管理有限公司（下称：港投公司）与思谋科技共同举办战略合作协议签约仪式。此次签约仪式得到了香港特区政府的高度重视，香港特别行政区行政长官李家超透过视频致辞，香港特别行政区政府财政司司长陈茂波到场见证签约并在午餐会发表主旨演讲。各界对港投公司与思谋科技在人工智能前沿科技产业化落地的合作，包括在粤港澳大湾区更广泛应用，助力区域经济的数字化、智能化转型等发展，寄予厚望。

6/12/2024 3:56:00 PM 我在思考中

早鸟倒计时3天丨院士领衔、重磅嘉宾云集！中国大模型大会（CLM2024）诚邀您共同探索中国大模型之路！详细日程公开

近年来，以GPTs为代表的大语言模型引起了全球各界的广泛关注，与之相关的新研究、新产品竞相绽放，颠覆了人们对于人工智能的理解，大模型技术正在引领科技创新的新潮流！为推动大语言模型以及基于大模型的自然语言处理技术的交流与创新，中国中文信息学会大模型指导委员会发起了中国大模型大会（China Large Language Model Conference，简称CLM）。 CLM大会由中国中文信息学会主办，与大模型技术密切相关的12个学会专业委员会共同协办。

6/12/2024 3:48:00 PM 我在思考中

GPT-4o 更容易越狱？北航 & 南洋理工上万次测试给出详细分析

GPT-4o，比上一代更容易被越狱攻击了？来自北航和南洋理工的研究人员，通过上万次的 API 查询，对 GPT-4o 各种模态的安全性进行了详细测试。结果发现，GPT-4o 新引入的语音模态带来了新的攻击面，而且多模态整体安全性不敌 GPT-4V。具体来说，研究人员针对 4 个常用的基准测试，对 GPT-4o 支持的三种模态（文本、图像、音频）进行了测试。测试一共涉及到 4000 初始文本查询的优化，8000 响应判断，16000 次 OpenAI 的 API 查询。基于此，研究人员撰写了详细的报告，给

6/12/2024 3:44:32 PM 清源

专访联想集团 CTO 芮勇：智能体是具身智能的基础｜具身智能十人谈

作者丨饶舒玮编辑丨岑峰在辽阔的未知海域，作为首席技术官的芮勇是决定联想集团这座巨轮技术路线的掌舵人之一。拥有七大国内外知名学会会士（ Fellow）桂冠、曾在微软工作近18年，芮勇在2016年选择了联想集团作为自己职业生涯的下一站。同年，联想集团聘用多位 AI 领域大牛，发力人工智能领域，从一家做设备的公司向一家设备云服务的公司加速转型。

6/12/2024 3:40:00 PM 饶舒玮

谷歌工程师批评 OpenAI，称其延缓 AGI 研究进展

TradingView 报道称，谷歌软件工程师弗朗索瓦・肖莱（François Chollet）在播客与主持人 Dwarkesh Patel 对话时，表达了他对 AGI（通用人工智能，Artificial General Intelligence）研究现状的担忧。肖莱表示，几年前所有最先进的研究成果都是公开分享和发表的，但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响，指责他们导致了“前沿研究出版的完全关闭”（complete closing down of frontier research pu

6/12/2024 3:07:56 PM 沛霖（实习）

拿下 6 亿欧元融资，“OpenAI 欧洲对手”Mistral 估值飙升至近 60 亿欧元

据《金融时报》北京时间今日凌晨报道，总部位于巴黎的 AI 初创公司 Mistral AI 现已筹集到 6 亿欧元的资金，估值接近 60 亿欧元（IT之家备注：当前约 468 亿元人民币）。该公司由微软、英伟达提供支持，成立至今刚满一年，被视作 OpenAI 的“潜在挑战者”。自（去年）12 月以来，对该公司的投资使其估值翻了三倍。Mistral 的首席执行官 Arthur Mensch 在接受采访时表示：“从创业之初，我们就被告知…… 这是一个永远不会被颠覆的市场。但我们证明事实并非如此，我们有效地颠覆了 Open

6/12/2024 2:52:36 PM 清源

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉