人工智能
西北工业大学开源语音理解模型OSUM,结合Whisper和Qwen2,支持8种语音理解任务
在人工智能领域,语言模型的快速发展引发了语音理解语言模型(SULMs)的广泛关注。 近日,西北工业大学 ASLP 实验室发布了开放语音理解模型 OSUM,旨在探索在学术资源有限的情况下,如何有效训练和利用语音理解模型,以推动学术界的研究与创新。 OSUM 模型融合了 Whisper 编码器与 Qwen2语言模型,支持8种语音任务,包括语音识别(ASR)、带时间戳的语音识别(SRWT)、语音事件检测(VED)、语音情感识别(SER)、说话风格识别(SSR)、说话人性别分类(SGC)、说话人年龄预测(SAP)及语音转文本聊天(STTC)。
2/20/2025 4:33:00 PM
AI在线
英伟达与美国机构发布生物学领域最大 AI 模型 Evo 2:机器可用核苷酸语言“思考”
据新华社消息,美国弧形研究所、英伟达和斯坦福大学等机构合作开发的AI生物学模型Evo 2于2月19日正式发布。
2/20/2025 2:57:40 PM
清源
预测所有物种DNA、RNA、蛋白质的形式和功能,Arc、斯坦福、NVIDIA发布最大AI生物模型Evo2
编辑 | 萝卜皮所有生命都用 DNA 编码信息。 虽然测序、合成和编辑基因组代码的工具已经改变了生物学研究,但智能地编写新的生物系统还需要深入了解基因组编码的巨大复杂性。 科学家们今天发布了他们所称的有史以来最大的生物学人工智能(AI)模型——Evo-2。
2/20/2025 2:57:00 PM
ScienceAI
GPU 内存交换技术,知多少?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的 GPU 内存交换机技术。 众所周知,LLMs 虽然在诸多任务中表现出色,但其庞大的模型体积和复杂的计算需求,使得高效利用 GPU 资源成为一大难题。 尤其是在高并发场景下,如何快速加载和卸载模型,避免 GPU 闲置,成为影响推理性能和成本的关键因素...一、GPU 设备资源调度的当前现状与困境随着AI 产业的持续落地,越来越多的公司开始将大型语言模型(LLMs)部署到生产环境,并确保能够大规模服务于用户。
2/20/2025 2:52:02 PM
架构驿站
谷歌DeepMind高管:AI 应助力人类能力,而非取代
在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上,众多科技行业的领导者聚集一堂,探讨人工智能在印度的变革潜力及其影响。 谷歌DeepMind的高级董事马尼什・古普塔(Manish Gupta)在会上发表了重要讲话,强调在推动技术创新的同时,应建立相应的规章制度,以确保负责任的发展。 图源备注:图片由AI生成,图片授权服务商Midjourney古普塔指出,随着印度在构建基础性人工智能模型方面取得显著进展,大家都在关注人工智能对就业市场的影响。
2/20/2025 2:20:00 PM
AI在线
超越炒作:四个应用实例揭示GenAI的实际奏效之处
如果说2023年是GenAI的初探之年,那么2024年无疑是它深入企业骨髓,展现真正实力的关键时期。 IBM在12月发布的一项针对2300名IT决策者的调查显示,47%的受访者已经见证了AI投资的回报,33%表示达到了收支平衡,仅有14%表示亏损。 更令人振奋的是,66%的公司计划增加对AI的投资,而计划减少投资的公司仅占5%。
2/20/2025 2:13:59 PM
Maria Korolov
全国首个罕见病领域 AI 大模型“协和・太初”发布,可进一步缩短确诊时间
北京协和医院、中国科学院自动化研究所共同研发出了国内首个罕见病领域AI大模型——“协和·太初”,已经面向患者开放测试初诊咨询和预约功能。
2/20/2025 2:09:21 PM
清源
Augury成功融资 7500 万美元,用AI检测工厂机器故障
在工业自动化和智能制造日益受到重视的今天初创公司Augury宣布成功融资7500万美元,估值超过10亿美元。 这一融资将用于吸引新客户并进一步研发其核心技术。 Augury专注于利用人工智能监测机器运行状态,通过测量振动、声音和温度等多个因素,及时识别设备的故障及维修需求。
2/20/2025 2:06:00 PM
AI在线
Meta 宣布建造全球最长海底电缆,助力人工智能基础设施
近日,Meta 公司正式宣布了名为 Project Waterworth的重大项目。 这项计划是一个历时数年的多亿美元投资,旨在建造一条超过50,000公里的海底电缆,以支持全球的人工智能基础设施。 这个海底电缆项目一旦完成,将成为全球最长的海底电缆,具有抵抗船锚和其他危险因素造成损坏的能力。
2/20/2025 12:00:41 PM
AI在线
谷歌发布全新视觉语言模型 PaliGemma 2 Mix 集成多种功能助力开发者
近日,谷歌宣布推出一款全新的视觉 - 语言模型(Vision-Language Model, VLM),名为 PaliGemma2Mix。 这款模型融合了图像处理与自然语言处理的能力,能够同时理解视觉信息和文本输入,并根据需求生成相应的输出,标志着人工智能技术在多任务处理方面的进一步突破。 PaliGemma2Mix 的功能非常强大,它集成了图像描述、光学字符识别(OCR)、图像问答、目标检测和图像分割等多种视觉 - 语言任务,适用于多种应用场景。
2/20/2025 11:37:00 AM
AI在线
英国初创公司 Humanoid 发布通用型人形机器人 HMND 01
近日,英国人工智能和机器人初创公司 Humanoid 在一段新视频中揭晓了其通用型人形机器人 HMND01。 这款机器人采用双足设计,模拟人类的运动和动作,配备有头部、躯干、手臂和腿部,五指手部具备高速且精准的操作能力,能够完成复杂的任务。 这得益于其搭载的众多高扭矩和高速的执行器。
2/20/2025 11:28:00 AM
AI在线
OpenAI的GPT-5即将问世:目前我们所知道的一切
想象一下,一个能浏览互联网、理解世界、记忆事物,还能像人一样自然聊天并进行复杂推理的AI。 这听起来像科幻电影里的情节,但实际上,这样的技术已经离我们不远了。 随着ChatGPT的不断进化,其最新版本GPT-5即将横空出世,预示着AI正朝着通用智能的目标大步迈进。
2/20/2025 11:20:41 AM
Bernard Marr
“AI 编程”炙手可热:初创公司 Codeium 获新一轮融资,估值推至 28.5 亿美元
据外媒TechCrunch今日报道,AI驱动的编程初创公司Codeium正进行新一轮融资,估值达到28.5亿美元(IT之家备注:当前约 207.57 亿元人民币)。
2/20/2025 10:51:30 AM
清源
从大模型性能优化到DeepSeek部署
一、背景Deepseek-r1模型的爆火标志着本地部署大模型的需求日益增长。 本文主要探讨如何优化本地部署大模型的性能,并结合我们的实践进行评测分析,文章最后我们将分享如何在本地高效部署满血版Deepseek-r1大模型。 在生产环境中,我们已部署专用的大模型推理集群,并对其性能进行了全面优化。
2/20/2025 9:27:46 AM
menglinggong
全面转型!Crunchbase 通过 AI 预测创业成功,准确率高达 95%!
Crunchbase 宣布将放弃其历史数据提供者的角色,转型为一款人工智能(AI)驱动的预测引擎。 这一新平台将能够以高达95% 的准确率预测创业公司的融资轮次、收购和成长轨迹,标志着 Crunchbase 的战略发生了重大转变。 Crunchbase 的首席执行官贾格・麦康奈尔在接受采访时表示,传统的历史数据行业已经走向衰亡。
2/20/2025 9:26:00 AM
AI在线
多地政务服务系统接入DeepSeek大模型 服务效率大提升
随着人工智能技术的迅速发展,越来越多的地方政府开始将 AI 引入政务服务,试图通过智能化手段提升服务质量和效率。 近期,北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手,标志着 AI 在政务领域的应用迈出了重要一步。 在北京经济技术开发区,新的智能政务小助手经过多家企业的测试后正式投入使用。
2/20/2025 9:23:00 AM
AI在线
谷歌推出“AI 实验室助理”:能推理分析、提出假设、优化方案
谷歌表示,在一项关于肝纤维化的实验中,这个“助理”提出的所有方法都展现了抑制疾病原因的潜力,且活性表现十分积极。
2/20/2025 8:30:53 AM
清源
DeepSeek服务器繁忙?实测30个接入平台,28个快速直达!
一、现象级表现. DeepSeek 自发布以来,热度直逼两年前 ChatGPT 横空出世的时候。 英伟达、亚马逊、微软等巨头率先接入,国内厂商也迅速跟进。
2/20/2025 12:35:33 AM
AI设计师Lena
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
AI新词
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Claude
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
大语言模型
生成
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
架构
生成式AI
DeepMind
编程
视觉
Transformer
预测
亚马逊
AI模型
特斯拉
MCP