应用

OpenDevin出技术报告了，大模型Agent开发者必读

8/2/2024 2:34:00 PM 机器之心

阿里国际将推出全球首个AI驱动的B2B搜索引擎

继日前OpenAI发布SearchGPT之后，被点燃的“AI Search”赛道再迎一全新的重量级选手：阿里国际研发的AI驱动的B2B搜索引擎将于今年9月正式亮相。当下，AI的出现彻底改变了搜索的体验。而阿里国际的新产品将是全球首个专业版AI搜索引擎，其应用场景和商业价值非常明确：专注于全球B2B电商，面向全世界的中小企业主群体，意在改变全球采购流程，使之更加直观和高效。它能用主动理解采购者的自然语言，并转化为专业的采购请求。更进一步，它还能根据全球市场数据预测需求、提供建议，实现更精准的匹配。据悉，该AI搜索引擎

8/2/2024 2:28:00 PM 新闻助手

最强开源文生图模型一夜易主：SD 原班人马打造，要发 SOTA 视频生成模型

感谢AI在线网友刺客的线索投递！最强开源文生图模型一夜易主！昨日晚间，开源文生图模型霸主 Stable Diffusion 原班人马，宣布推出全新的图像生成模型 FLUX.1。FLUX.1 包含专业版、开发者版、快速版三种模型，其中前两款模型击败 SD3-Ultra 等主流模型，较小规模的 FLUX.1 [schnell] 也超越了 Midjourney v6.0、DALL・E 3 等更大的模型。▲ FLUX.1 ELO 分数与主流模型对比FLUX.1 在文字生成、复杂指令遵循和人手生成上具备优势。以下是其最强

8/2/2024 2:22:20 PM 汪淼

Nature：谷歌 AI 研究引用量登全球榜首，中国企业腾讯、阿里、华为前十

Nature 最近报道了一个新发布的 AI 行业数据库 PARAT，分析显示，在论文引用、专利申请等方面，美国和中国企业占据了主导地位。在 AI 领域，硅谷巨头 Alphabet（谷歌母公司）和微软的论文引用量最高，远超其他公司。不过，中国企业百度和腾讯在专利方面领先。这些结果来自新兴技术观察站（ETO）发布的 PARAT 数据库，该工具跟踪私营部门的 AI 相关活动，包括研究和专利的发表，以及人才指标，帮助我们洞见 AI 发展趋势。ETO 是隶属于安全与新兴技术中心（CSET），后者的总部设在乔治城大学外交学院，

8/2/2024 1:33:05 PM 汪淼

大模型成私人导游：一键规划 Citywalk，港大 MIT 联合出品

现在，大模型可以做私人导游，为你规划 Citywalk 路线了 ——港大 MIT 等单位联合推出 ITINERA，将 LLM 与空间优化相结合，实现个性化的开放域城市行程规划。举个栗子，用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的 citywalk 路线”。ITINERA 系统立马生成了一条包含若干地点的路线，并提供了相应的介绍文本。甚至“适合情侣一起去的酒吧”“二次元圣地”“途经网红打卡点”这样的个性化需求，ITINERA 也可以理解和满足。单看可能没感觉，咱们直接对比 ITINERA（左侧）和 GPT

8/2/2024 1:24:19 PM 汪淼

OpenAI 喜提姚班学霸姚顺雨：思维树作者，普林斯顿博士，还是个 Rapper

清华姚班学霸姚顺雨，官宣加入了 OpenAI。而就是这么一则简短的消息，却引来了圈内众人的围观和祝福，来感受一下这个 feel：其中不乏像 OpenAI 前沿研究主管、美国 IOI 教练 Mark Chen，以及 AI 领域的教授、投资人等等。那么这位姚顺雨，到底为何能够引来如此关注？从他过往的履历来看，我们可以提炼出这样几个关键词：清华姚班姚班联席会主席清华大学学生说唱社联合创始人普林斯顿计算机博士▲ 姚顺雨，图源：个人主页但除了较为亮点的履历之外，真正让姚顺雨步入公众的视野，还是因为他的多项科研成果：思维树（T

8/2/2024 1:17:55 PM 汪淼

Stable Diffusion 原班人马新公司官宣！新模型一夜刷新 AI 绘画格局，已获 3200 万美元融资

刚刚，Stable Diffusion 原班人马官宣创业新公司！3 月宣布从 Stability AI 出走的 Robin Rombach，就是 Stable Diffusion 的两个主要作者之一，和十来个原公司小伙伴，正式宣布了组团创业的消息。新公司名叫 Black Forest Lab，黑森林实验室。一亮相就 kuku 发了一个系列、共 3 款图片生成模型，其中有 2 个开源。而且支持中文输入。效果怎么样？看过的网友称很狂野（wild）！输入提示词，一次测试出了画面效果和人脸数据等安全措施：一名十多岁戴着滑雪

8/2/2024 1:11:34 PM 清源

Suno 承认使用版权音乐训练 AI 模型，“取经”学习不算侵权

感谢音乐 AI 公司 Suno 昨日（8 月 1 日）发布博文，回应三大唱片公司提起的诉讼，承认曾使用过这三大唱片公司的唱片内容来训练 AI，不过该公司认为根据合理使用原则，这样做是合法的。美国唱片协会提起诉讼美国唱片业协会（RIAA）于 6 月 24 日，起诉 Udio 和 Suno 两家音乐生成初创公司，指控这两家公司使用受版权保护的音乐来训练 AI 模型。这些音乐涉及来自环球音乐集团（Universal Music Group）、索尼音乐公司（Sony Music）和华纳音乐公司（Warner Music）三

8/2/2024 12:47:12 PM 故渊

微软 GitHub 推出 Models 服务：定位 AI 工程师，让开发者试用和部署模型

感谢微软旗下代码托管平台 GitHub 最新推出了 GitHub Models 服务，定位是新一代 AI 工程师，帮助开发者选择适合其应用的 AI 模型。GitHub 在官方新闻稿中表示，GitHub Models 将服务该平台 1 亿多用户，为其提供业界领先的大语言模型（LLM）或者小语言模型（SLM）。 AI在线注：GitHub Models 服务目前处于限量公测阶段，可以对接 OpenAI 的 GPT-4o 和 GPT-4o mini、微软的 Phi 3、Meta 的 Llama 3.1 以及 Mistral

8/2/2024 10:50:52 AM 故渊

埃斯顿机器人获 4.5 亿元增资；AI 大牛周志华任南京大学副校长；论文也能发弹幕！斯坦福在线论文平台火爆丨AI情报局

今日融资快报埃斯顿：拟4.5亿元对全资子公司埃斯顿机器人增资埃斯顿公告，公司拟使用自有资金4.5亿元对全资子公司南京埃斯顿机器人工程有限公司进行增资，其中3亿元计入注册资本，1.5亿元计入资本公积。此次增资完成后，埃斯顿机器人的注册资本将由1.5亿元增加至4.5亿元，公司仍持有埃斯顿机器人100%的股权。埃斯顿于 1993 年在南京注册设立，2015 年在深交所上市，是国产智能工业机器人“四小龙”之一。

8/2/2024 10:07:00 AM 我在思考中

AI实战案例！钉钉如何用AI做好教育服务设计？

一、教育钉介绍和业务分析钉钉教育被人所熟知主要是疫情期间的分期五星好评。疫情期间，我们支持了全国 14 万所学校、600 万教师、1.3 亿学生的在线上课。我们从大年初二开始在家上班，不记得通宵过多少个晚上，升级功能，优化体验，就是为了学生们有课上。现在 AI 时代刚刚到来，我们要做怎样的设计？我也不知道，AI 都会写代码了？设计师会不会被取代？但我知道的是设计要紧贴业务、设计是为人服务的。AI 无论再怎么发展，创新、同理心、共情是它永远所不具有的。从宏观的涉众关系来看，办公人群是自上而下的行政管理，搞

8/2/2024 8:03:18 AM 团队钉钉设计

欧盟《人工智能法案》正式生效，罚款最高达全球年营业额 7%

感谢在欧盟官方发布《人工智能法案（Artificial Intelligence Act）》最终完整版本 20 天后，全球首部全面监管人工智能的法规于当地时间 8 月 1 日正式生效。据介绍，《人工智能法案》旨在确保在欧盟开发和使用的人工智能是值得信赖的，并有保障措施保护人们的基本权利。该法规旨在在欧盟建立一个统一的人工智能内部市场，鼓励采用这项技术，并为创新和投资创造一个支持性的环境。《人工智能法案》规定，对违反被禁止的人工智能应用程序的罚款可能高达全球年营业额的 7%，对违反其他义务的罚款最高可达 3%，对提供

8/1/2024 10:11:12 PM 浩渺

30 秒让照片动起来，首个国产纯自研视频大模型 Vidu 上线

感谢首个国产纯自研视频大模型 Vidu 上线，目前向用户开放了文生视频、图生视频两大核心功能，提供 4 秒和 8 秒两种时长选择，分辨率最高为 1080P。用户无需申请，使用邮箱注册即可体验。 AI在线附 Vidu 官网：www.vidu.studioVidu 模型于今年 4 月在 2024 中关村论坛首次亮相，由清华大学与生数科技联合发布，其核心技术 U-ViT 架构由团队在 2022 年 9 月提出，早于 Sora 采用的 DiT 架构，是全球首个 Diffusion 与 Transformer 融合的架构。▲

8/1/2024 4:44:43 PM 沛霖（实习）

Poe 的新功能好强！编程0基础，也能10分钟整出一个梗图编辑器

机器之能报道编辑：Sia国内大模型是不是要迅速跟上？最近，「北美知乎」问答社区 Quora 旗下的 AI 聊天平台 Poe，推出了一项名为「 Previews 」的新功能。有了这个实时预览功能，用户就能直接查看和使用在 Poe 聊天中生成的 Web 应用程序。也就是说，在 Poe ，你可以和一些非常擅长编码的 LLM 聊天，如 Claude-3.5-Sonnet 、GPT-4、Gemini 1.5 Pro 。聊天过程中生成的代码片段、网页设计、游戏等内容，都能在这个窗口预览到，还能上手体验。上手体验第一把

8/1/2024 4:02:00 PM 机器之能

OpenAI 测试长输出版 GPT-4o：单次 64K tokens，每百万 tokens 输入 6 美元、输出 18 美元

感谢OpenAI 于 7 月 29 日宣布，正在测试长输出版 GPT-4o（GPT-4o Long Output），每次请求最多可输出 64K tokens。目前该版本仅限 Alpha 测试参与者使用，可通过使用“gpt-4o-64k-output-alpha”模型名称来访问长输出版 GPT-4o。OpenAI 表示，由于长输出版本推理成本更高，因此该模型的定价有所增加，每百万 tokens 输入价格为 6 美元（AI在线备注：当前约 43 元人民币）、每百万 tokens 输出价格为 18 美元（当前约 130

8/1/2024 3:47:55 PM 沛霖（实习）

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

谷歌也来卷「小」模型了，一出手就是王炸，胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底，谷歌开源了 9B、27B 版 Gemma 2 模型系列，并且自亮相以来，27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一，在真实对话任务中比其两倍规模以上的模型表现还要好。如今，仅仅过去了一个多月，谷歌在追求负责任 AI 的基础上，更加地考虑该系列模型的安全性和可访问性，并有了一系列新成果。此次，Gemma 2 不仅有了更轻量级「Gemma 2

8/1/2024 3:18:00 PM 机器之心

邓雅文飞夺中国奥运第8金阿里云“子弹时间”定格最炫瞬间

7月31日晚，在巴黎奥运会自由式小轮车女子公园赛决赛中，18岁中国选手邓雅文高水平发挥，为中国代表团夺得第8金。在比赛直播中的回放环节，邓雅文骑着小轮车高高跃起的身姿突然定格，镜头环绕，将这个瞬间的美感放大，给观众带来前所未有的视觉享受。这就是网上热议的奥运“子弹时间”，技术来自中国的阿里云。（图巴黎奥运会资格赛期间进行了多镜头回放系统测试）“子弹时间”覆盖21个项目据奥林匹克广播服务公司（以下简称OBS）介绍，巴黎奥运会采用中国阿里云AI增强的全新转播技术——多镜头回放系统。该系统让转播有了科幻电影般的视觉效果

8/1/2024 2:47:00 PM 新闻助手

还没排上SearchGPT？比Perplexity更好用的国产开源平替了解一下？

来自上海人工智能实验室。有 AI 在的科技圈，似乎没有中场休息。除了大模型发布不断，各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。OpenAI 首先瞄准的是谷歌 1750 亿美元的搜索业务市场。7 月 25 日，OpenAI 带着 AI 搜索引擎——SearchGPT 高调入场。在演示 demo 中，搜索引擎的使用体验不再像以往一样，需要我们逐个点开网页链接，判断信息有没有用。SearchGPT 像端上了一桌精美的套餐，所有答案都帮你总结好了。

8/1/2024 2:45:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

应用

OpenDevin出技术报告了，大模型Agent开发者必读

阿里国际将推出全球首个AI驱动的B2B搜索引擎

最强开源文生图模型一夜易主：SD 原班人马打造，要发 SOTA 视频生成模型

Nature：谷歌 AI 研究引用量登全球榜首，中国企业腾讯、阿里、华为前十

大模型成私人导游：一键规划 Citywalk，港大 MIT 联合出品

OpenAI 喜提姚班学霸姚顺雨：思维树作者，普林斯顿博士，还是个 Rapper

Stable Diffusion 原班人马新公司官宣！新模型一夜刷新 AI 绘画格局，已获 3200 万美元融资

Suno 承认使用版权音乐训练 AI 模型，“取经”学习不算侵权

微软 GitHub 推出 Models 服务：定位 AI 工程师，让开发者试用和部署模型

埃斯顿机器人获 4.5 亿元增资；AI 大牛周志华任南京大学副校长；论文也能发弹幕！斯坦福在线论文平台火爆丨AI情报局

AI实战案例！钉钉如何用AI做好教育服务设计？

欧盟《人工智能法案》正式生效，罚款最高达全球年营业额 7%

30 秒让照片动起来，首个国产纯自研视频大模型 Vidu 上线

Poe 的新功能好强 ！编程0基础，也能10分钟整出一个梗图编辑器

OpenAI 测试长输出版 GPT-4o：单次 64K tokens，每百万 tokens 输入 6 美元、输出 18 美元

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

邓雅文飞夺中国奥运第8金 阿里云“子弹时间”定格最炫瞬间

还没排上SearchGPT？比Perplexity更好用的国产开源平替了解一下？

Poe 的新功能好强！编程0基础，也能10分钟整出一个梗图编辑器

邓雅文飞夺中国奥运第8金阿里云“子弹时间”定格最炫瞬间