应用
人人都是有声书创作者:ElevenLabs 开放 AI 语音技术,让你的文字“声”动人心
ElevenLabs发布ElevenReader Publishing平台,利用AI技术帮助作者快速制作专业的有声书。该平台提供语音定制、节奏控制等个性化功能,并支持变现渠道。#AI科技资讯 #有声书
2/27/2025 10:42:45 AM
故渊
Hugging Face 推出 FastRTC:实时语音视频应用开发变得轻而易举
AI 初创公司 Hugging Face 宣布推出 FastRTC,这是一个开源的 Python 库,旨在消除开发人员在构建实时音频和视频 AI 应用时面临的重大障碍。 Hugging Face 的 FastRTC 旨在简化 WebRTC 和 Websocket 应用的构建过程。 Freddy Boulton,FastRTC 的创建者之一表示:“在 Python 中,构建实时 WebRTC 和 Websocket 应用非常困难,直到现在才有所改变。
2/27/2025 10:41:00 AM
AI在线
AI工具在大学生中普及 老师表示AI作文全判0分
近期,央视新闻报道指出,AI工具已成为大学生完成报告、论文的“神器”。 然而,这一现象也引发了学术不端行为的担忧。 一些高校教师和专家表示,少数学生利用AI伪造研究数据、编辑实验图片等,严重影响了学术诚信。
2/27/2025 10:34:00 AM
AI在线
全球AI顶会AAAI 2025 在美开幕,产学研联手的“中国队”表现亮眼
当地时间2月25日,AAAI 2025 在美国宾夕法尼亚州费城举办,会议为期8天,于3月4日结束。 AAAI 由国际人工智能促进协会主办,是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议,每年举办一届。 AAAI 2025 共有12957篇有效投稿,录用3032篇,录取率为 23.4%。
2/27/2025 10:28:00 AM
新闻助手
极氪智能科技首创汽车座舱端侧AI大模型离线部署
在智能汽车领域,极氪智能科技日前宣布了一个引人注目的成就:成功完成了汽车行业首个端侧 AI 大模型的离线部署。 这一技术的实现,不仅意味着极氪在汽车智能化进程中迈出了重要一步,更是为用户带来了全新的驾驶体验。 通过这一技术,极氪汽车将能够在不依赖网络的情况下,实时进行图文理解与推理,大大提升了车辆的智能化水平。
2/27/2025 10:15:00 AM
AI在线
阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行
近日,阿里巴巴在深夜推出了全新的开源视频生成模型 Wan2.1,该模型凭借14B 的参数量迅速占据了 VBench 榜单的顶端,成为目前视频生成领域的佼佼者。 与此之前发布的 QwQ-Max 不同,Wan2.1在复杂运动的细节处理上表现出色,能够流畅地实现多个人物的同步舞蹈,令人惊叹不已。 官方演示中,Wan2.1不仅成功克服了静态图像生成中的难题,如文字的处理更是达到了新的高度。
2/27/2025 10:08:00 AM
AI在线
字节跳动悟空浏览器接入DeepSeek R1模型,或为抖音接入铺路
字节跳动旗下悟空浏览器近日正式接入DeepSeek R1模型,这一举措引发业界广泛关注。 与此前飞书、火山引擎接入DeepSeek不同,悟空浏览器作为面向C端用户的产品,融合了抖音与番茄小说等内容,其接入被认为可能为抖音未来接入DeepSeek铺路。 目前,悟空浏览器同时搭载豆包与DeepSeek两大模型,DeepSeek R1主要负责智能对话与文本生成,而豆包则提供AI快捷功能,应用场景更为广泛。
2/27/2025 10:06:00 AM
AI在线
卓世科技:text2SQL技术浅谈
text2sql 技术是一种将自然语言(NL)转化为可被数据库执行的结构化查询语言 SQL 的技术。 自然语言可以是我们熟悉的一段文本,也可以是一段语音,又或者是其它可转化为文本的输入形式。 通过该技术,能够让不懂数据库操作的非技术人员提取、分析数据,无需学习编写 SQL 语句,无需了解不同 SQL 数据库的使用软件,通过输入文本描述的问题需求,即可得到对应需求下的数据结果。
2/27/2025 10:05:00 AM
特邀精选
特朗普发布 AI 生成视频,描绘了一个“加沙乐园”
日前,美国前总统唐纳德・特朗普在他拥有控股权的社交媒体平台 Truth Social 上,发布了一段引发广泛关注的 AI 生成视频。 该视频试图描绘一个由特朗普统治的加沙地带的未来景象,内容奇幻且引人瞩目。 视频开头呈现了一个战火纷飞的加沙场景,身着武装装备的阴影人物在废墟中游荡,孩童在危机中奔跑。
2/27/2025 10:00:00 AM
AI在线
ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%
ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。 该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。 根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。
2/27/2025 9:56:00 AM
AI在线
英伟达CEO黄仁勋: DeepSeek不会对公司销售造成影响,销量持续攀升
在近日的财报电话会议上,英伟达 CEO 黄仁勋对公司的未来展望依旧充满信心,尽管上个月因中国的 DeepSeek 技术引发了一场市场恐慌。 他表示,DeepSeek 的推出不会对公司的销售造成影响。 市场对 DeepSeek R1模型所需的芯片数量大幅减少的猜测,曾导致英伟达的股价出现了创纪录的下跌。
2/27/2025 9:53:00 AM
AI在线
2025年AI大模型价格战加剧,相关概念股受到资金追捧
近年来,人工智能(AI)大模型技术发展迅猛,随之而来的降价潮使得市场竞争愈发激烈。 根据数据宝的最新统计,2025年这一降价趋势仍将持续。 尤其是在过去的一段时间里,字节跳动、阿里云等企业纷纷宣布降低旗下 AI 大模型的使用成本,引发了业界的广泛关注。
2/27/2025 9:49:00 AM
AI在线
微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级
近日,微软进一步扩展了 Phi-4家族,推出了两款新模型:Phi-4多模态(Phi-4-multimodal)和 Phi-4迷你(Phi-4-mini),这两款模型的亮相,无疑将为各类 AI 应用提供更加强大的处理能力。 Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型,拥有5600万参数。 这款模型在多项基准测试中表现优异,超越了目前市场上的许多竞争对手,例如谷歌的 Gemini2.0系列。
2/27/2025 9:38:00 AM
AI在线
大学老师说AI作文全判0分 网友:过度依赖造成思维惰性
近年来,随着人工智能技术的迅速发展,AI 工具逐渐成为大学生完成各类报告和论文的 “得力助手”。 根据央视新闻的报道,部分高校教师和专家表示,利用 AI 生成内容的学生中,个别案例涉及不当行为,如伪造研究数据、编辑实验图片和替代自主设计等,已构成学术不端。 在某高校的作业群中,一则通知引起了学生们的广泛关注。
2/27/2025 9:34:00 AM
AI在线
Hume推出革命性文本转语音系统Octave:能理解情感与上下文
在人工智能领域,Hume AI公司最近宣布推出其全新产品Octave,这一系统被称为首个由大型语言模型(LLM)驱动的文本转语音系统。 Octave的创新之处在于其不仅能够生成自然的语音,还能理解上下文中的情感、语调、节奏和韵律,从而为用户提供更为生动和人性化的语音输出。 Hume AI的联合创始人兼首席执行官Alan Cowen在接受媒体采访时表示,Octave模型的设计初衷是为了使文本转语音的生成过程更加自然和灵活。
2/27/2025 9:27:00 AM
AI在线
19岁女棋手因用AI作弊被禁赛8年,撤销职业段位
日前,中国围棋协会对一名年轻棋手的严重违规行为做出了严厉处罚。 根据协会发布的通报,19岁的职业棋手秦思玥因在比赛中使用手机上运行的人工智能程序作弊,被处以禁赛8年和撤销职业段位的重罚。 事件发生在2024年12月15日,当天,秦思玥在全国围棋锦标赛女子组第九轮比赛中,被裁判在赛中进行的例行抽检中发现携带手机。
2/27/2025 9:19:00 AM
AI在线
微软 Phi-4 多模态及迷你模型上线,语音视觉文本全能
微软推出Phi-4多模态和Phi-4迷你模型,多模态模型集成语音、视觉和文本处理,表现卓越;迷你模型专注于文本任务,性能优异。两款模型已在多个平台上线,为AI应用带来强大处理能力。#微软#AI技术#多模态模型
2/27/2025 9:04:02 AM
远洋
职业棋手比赛私藏手机用 AI 作弊被抓现行,被中国围棋协会撤销段位、禁赛 8 年
19岁的职业围棋手秦思玥在全国围棋锦标赛中因使用AI作弊被抓。中国围棋协会对其作出撤销职业段位、取消比赛成绩及禁赛8年的处罚。#围棋# #AI作弊#
2/27/2025 8:43:12 AM
远洋
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind