应用
阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper
阿里云通义千问开源了两款语音基座模型 SenseVoice(用于语音识别)和 CosyVoice(用于语音生成)。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测,有以下特点:多语言识别:采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果;支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测高效推理: SenseVoice-Sma
7/9/2024 10:17:59 AM
沛霖(实习)
腾讯智影小程序上线 AI 视频功能,限时免费一键生成风格化视频
感谢腾讯智影小程序上线了智影 AI 视频功能,可以一键生成风格化视频,目前有日漫风格可选,此功能限时免费(未公布收费价格)。视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。▲ 左为原视频、右为风格化视频只需导入视频并一键“变身”,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。▲ 智影 AI 提供的模板据AI在线此前报道,腾讯智影上线于 2023 年 3 月,是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人
7/9/2024 9:13:39 AM
沛霖(实习)
5000字爆肝测评!六月AI资讯及实用测评合集
前言
在过去的 30 天里,AI 圈又发生了哪些劲爆大事件?赶紧来看看我们精心整理的一手 AIGC 资讯和深度分析测评,我们的 AIGC 爆肝 30 天测评又和大家见面了。
继前两期 AIGC 测评文章发布之后,我们也收到了许多积极的反馈,对于还未阅读过的同学,欢迎通过以下链接直接访问浏览。在本系列的第一章,我们还是会快速给大家概述下国内外 AI 圈领域的重要资讯和动态,第二章,除了既往介绍我们筛选后的重点实测产品以外,我们还将探讨和分析一些感兴趣的 AI 特定领域内容或者工具的对比研究,第二章会给大家详细介绍以下
7/9/2024 6:58:24 AM
团队新浪MDC
北大千问团队推出数学专用版 CriticGPT,“找茬”让大模型进步更快
批评不仅能让人进步,也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在 CriticGPT 放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上,它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注,然后用得到的数据训练出
7/8/2024 11:30:24 PM
清源
古尔曼:苹果首款支持 Apple Intelligence 的智能家居设备将是一款桌面机器人
苹果备受期待的“Apple Intelligence”功能今年晚些时候将首先登陆 iPhone、iPad 和 Mac 设备,而包括 HomePod 智能音箱、Apple Watch 手表和 Vision Pro 头显等产品将暂时无缘这个功能,其中也包括备受关注的新版 Siri 语音助手。现据彭博社记者马克・古尔曼 (Mark Gurman) 透露,苹果首款搭载 Apple Intelligence 功能的智能家居设备将是一款全新的桌面机器人。古尔曼表示,期待在现有苹果智能家居设备上使用 Apple Intelli
7/8/2024 11:13:47 PM
远洋
院士领衔推出大模型的第 3 种记忆:比参数存储和 RAG 都便宜,2.4B 模型越级打 13B
给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!中科院院士鄂维南领衔,上海算法创新研究院等团队推出 Memory3,比在参数中存储知识以及 RAG 成本都更低,同时保持比 RAG 更高的解码速度。在实验中,仅有 2.4B 参数的 Memory3 模型不仅打败了许多 7B-13B 的模型,在专业领域任务如医学上的表现也超过了传统的 RAG 方法,同时推理速度更快,“幻觉”问题也更少。目前相关论文已上传到 arXiv,并引起学术界关注。知识按使用频率分类这一方法受人脑记忆原理启发,独立于存储在模型参数
7/8/2024 11:09:43 PM
清源
中国开源操作系统 openKylin(开放麒麟)发布 AIPC 版本
AI在线从 openKylin 公众号获悉,7 月 7 日,聚焦智能时代基础软件发展的 2024 CCF(中国计算机学会)系统软件技术论坛在长沙举行,会上中国开源操作系统 openKylin(开放麒麟)推出了全新 openKylin for AIPC 版本。openKylin 社区技术委员会委员余杰、刘晓东在会上带来《openKylin for AIPC— 基于端侧大模型的操作系统智能引擎构建技术》主题报告,介绍 openKylin 社区团队在“openKylin 开源操作 九格端侧大模型”上通过在模型层、系统
7/8/2024 8:22:42 PM
远洋
人工智能测谎技术问世:比人类更强,但需谨慎使用
近年来,人们在分辨真假信息方面遇到越来越多的挑战,尤其是网络上充斥大量的虚假新闻和夸大宣传。研究表明,人类在判断真假话方面表现得并不好。图源 Pexels据AI在线了解,传统测谎手段,例如测谎仪,因其准确性问题而饱受诟病。一些人认为,人工智能 (AI) 可以帮助我们提高识别谎言的准确率。未来的某一天,基于人工智能的测谎系统或许能帮助我们识别社交媒体上的虚假信息、评估网络上的各种言论,甚至还能甄别求职者的简历和面试回答中的夸大之处。然而,问题在于我们是否会信任这些系统,以及它们是否值得信赖。德国维尔茨堡大学经济学家
7/8/2024 7:41:13 PM
远洋
完蛋!又来了一个人工智障,口无遮拦瞎回复,把微博大V整破防
机器之能报道编辑:杨文碎嘴子的AI小助理,一点不懂人情世故。别家都在疯狂卷大模型、卷 AI 视频、卷 AI 生图,唯独新浪微博,在评论小机器人上蒙眼狂飙。继那个赛博 gai 溜子「评论罗伯特」后,微博又推出了一款AI 小助理。微博官方给它立的人设是这样的:AI 小助理能够根据博主发布的历史内容,学习博主的语言风格,并以博主的口吻回复粉丝的评论,或者与粉丝进行聊天对话。理想很丰满,现实很骨感。这个 AI 小助理不按套路出牌,那小嘴跟淬了毒似的,创飞每一个喘气的人类。-1-驴唇不对马嘴瞎回复近日,微博正在小流量测试一款
7/8/2024 6:49:00 PM
机器之能
上交大洪亮课题组&上海AI实验室团队发布FSFP,基于语言模型的蛋白质功能小样本预测方法,登Nature子刊
编辑 | ScienceAI近日,上海交通大学自然科学研究院/物理天文学院/张江高研院/药学院洪亮教授课题组,联合上海人工智能实验室青年研究员谈攀,在蛋白质突变-性质预测上取得重要突破。该工作采用全新的训练策略,在使用极少湿实验数据的情况下,极大地提高了传统蛋白质预训练大模型在突变-性质预测的效果。该研究成果以《Enhancing the efficiency of protein language models with minimal wet-lab data through few-shot learning
7/8/2024 6:46:00 PM
ScienceAI
Nature子刊,优于AlphaFold,全原子采样,一种预测肽结构的AI方法
编辑 | 萝卜皮深度学习方法推动了生物分子结构单态预测的重大进展。然而,生物分子的功能取决于它们可以呈现的构象范围。对于肽来说尤其如此,肽是一类高度灵活的分子,参与多种生物过程,作为治疗手段备受关注。多伦多大学的 Philip M. Kim 和 Osama Abdin 开发了 PepFlow,这是一种可转移生成模型,它能够从输入肽的允许构象空间中直接进行全原子采样。研究人员在扩散框架中训练模型,然后使用等效流进行构象采样。为了克服广义全原子建模的成本过高,他们模块化了生成过程并集成了超网络来预测序列特定的网络参数。
7/8/2024 6:40:00 PM
ScienceAI
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。 过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI、谷歌、苹果,到国内的阿里巴巴、字节跳动、腾讯等一众企业纷纷出新,还不约而同地选择将大模型技术落地到产业应用之中。 AI 企业们似乎都在向世界宣告:科幻电影中的 AGI 将成现实。
7/8/2024 4:53:00 PM
赖文昕
ChatGPT 无法取代人类程序员: IEEE 35 页论文测出困难编码正确率仅为 0.66%
【新智元导读】6 月,IEEE 刊登了一篇对 ChatGPT 代码生成任务进行系统评估的论文,数据集就是程序员们最爱的 LeetCode 题库。研究揭示了 LLM 在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用 ChatGPT 写代码的最佳姿势。有了 ChatGPT,还需要人类程序猿编码吗?上个月,一项发表在 IEEE TSE 期刊(Transactions on Software Engineering)上的研究评估了 ChatGPT 所生成的代码在功能性、复杂性和安全性方面
7/8/2024 4:46:28 PM
清源
理财AI勇闯「无人区」:理解专家、成为专家
这是一条少有人走过的路。 用十年时间成为全球在线服务数亿用户的财富管理平台后,摆在蚂蚁财富面前的是一段少有人走过的路: 这 5 亿活跃用户第一次动动手就能接触到各类普惠的理财产品,但真正理财行为成熟的仅占两成。而放眼中国 7.2 亿基金投资者里,每 3600 人才能分到 1 位传统理财顾问来服务。投多顾少,对很多普通投资者来说,往往处于专业服务的「无人区」。俗话说,「瞎子引瞎子,二人掉深渊」,用户侧对专业服务的需求呼唤技术的进步。 2020 年,「 AI 理财助理」支小宝正式对外上线,蚂蚁财富希望能补足行业服务的空
7/8/2024 4:31:00 PM
机器之心
主打个性化体验,留住用户全靠AIGC?
今天要购买一件商品,我们都会先在社交媒体上搜索、浏览商品的评价,这使得企业在社交平台上针对产品进行营销变得越来越重要。营销的目的是为了促进产品的销售,树立品牌形象,提高品牌认知度,吸引并留住客户,最终提高企业的盈利能力。我们知道,大模型具备出色的理解和生成能力,可以通过浏览、分析用户数据,为用户提供个性化内容推荐,精准满足用户的需求,而这正是营销的关键所在。那么,AIGC 如何通过个性化提升营销转化率呢?在火山引擎和 NVIDIA 联手AI在线和 CMO CLUB 推出的视频栏目《AIGC 体验派》第四期中,两位嘉
7/8/2024 4:25:00 PM
机器之心
像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了
生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构。然而,人工神经网络主要被设计为静态的、完全连接的结构,在面对不断变化的环境和新的输入时可能非常脆弱。尽管研究人员对在线学习和元学习进行了大量研究,但目前最先进的神经网络系统仍然使用离线学习,因为这与反向传播结合使用时更加简单。那么,人工神经网络是否也能拥有类似于高度可塑性的性质?来自哥本哈根信息技术大学的研究团队提出了一种自组织神经网络 ——LNDP,能够以活动和奖励依赖的方式实现突触和结构的
7/8/2024 4:22:00 PM
机器之心
从智算到密算,大模型数据困境新解法 | 智者访谈
大模型产业发展,需要可信中立的数据深加工平台,如何填补空白?2024 世界人工智能大会(2024 WAIC)落幕,围绕「算法、算力和数据」AI 三大要素如何持续演进发展的讨论,贯穿了三天的会期,全球顶级学者带来前沿构想,产业界带来创新的解决方案。最为聚焦的还是大模型从通用走向应用,如何在这三个维度上实现突破性的进展。其中的共识是,高质量的数据供给是大模型产业发展的关键,是决定大模型是「专家」或是「砖家」一条分界线。然而,获取高质量数据的核心在于数据安全可信流通,打破数据孤岛这一老问题,在新的产业变革趋势下,变得更为
7/8/2024 4:09:00 PM
机器之心
达摩院发布一站式AI视频创作平台"寻光",打造全新AI工作流
今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。但新技术也引发更多的挑战与质疑,除了大家熟知的 “开盲盒” 现象,AI 所生成的视频内容也因可控性差、处理工作流繁琐而频频被诟病。OpenAI 曾经邀请专业视频制作团队对 Sora 进行了测试,其中来自于多伦多的 Shy Kids 团队,利用 Sora 制作了一个气球人主题的短片,把创意和 AI 技术进行了完美的结合,让人印象深刻。整个短片其实
7/8/2024 4:06:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用