应用
消息称百度文心 4.5 模型计划 3 月中旬发布,推理及多模态能力将获提升
知情人士表示,升级后的文心 4.5 将具备更强的多模态能力。多模态AI系统能够处理和整合文本、视频、图像、音频等不同类型的数据,并能在不同格式之间进行转换。
Adobe推出Photoshop iOS版本,提供丰富免费功能与无缝跨设备体验
根据近日在X平台上的最新消息,Adobe正式推出了适用于iOS设备的Photoshop应用程序,为用户带来了众多免费功能以及便捷的跨设备操作体验。 这一版本的发布标志着Photoshop进一步向移动端扩展,满足了新一代创作者的需求。 据报道,Photoshop iOS版本内置了该软件的核心功能,包括选择工具、图层管理和蒙版操作,用户可以轻松实现图像的组合、合成与混合。
推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。
B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿
B站的一款基于 XTTS 和 Tortoise 的 GPT 风格文本转语音(TTS)模型 IndexTTS 正式发布。 该系统在处理中文文本时,具备独特的拼音纠正汉字发音能力,并能够通过标点符号在任意位置精准控制停顿。 这一创新的技术使得文本转语音的效果更加自然流畅,受到了广泛关注。
颠覆操作习惯!Raycast 推出 AI 神器:动动嘴就能操控电脑上的一切!
厌倦了在各种应用之间来回切换的繁琐操作?受够了被各种复杂指令和界面支配的“人机交互”? 效率神器 Raycast 再次放大招了!他们最新推出的 AI Extensions 功能,简直要彻底颠覆你与电脑的交互方式—— 现在,你只需动动嘴皮子,就能像指挥私人助理一样,操控电脑上的一切应用!想象一下,你无需打开日历 App,只需在 Raycast 中轻敲 @ai,然后说一句“下周三下午三点安排个会议”,会议就自动安排好了! 这种感觉就像科幻电影照进现实,你不再需要学习各种软件的复杂操作,只需用最自然的语言告诉电脑“你想做什么”,剩下的,就交给 Raycast 的 AI Extensions 吧!更令人叫绝的是,这一切都无需打开应用本身!
我国牵头“机器人 + 养老”国际标准发布,应对全球老龄化
2月27日消息,据央视报道,近日国际电工委员会(IEC)正式发布由我国牵头制定的养老机器人国际标准(IEC63310《互联家庭环境下使用的主动辅助生活机器人性能准则》)。 该标准依据老年人生理、心理和行为特点,聚焦互联家居环境中老年人在日常生活、健康护理等方面的需求和特征,为养老机器人的产品设计、制造、测试和认证等提供基准。 世界卫生组织数据显示,预计2050年全球60岁以上人口数量将达21亿,其中80岁以上老年人有4.26亿。
阿里启动2026届春招,开放3000岗位AI相关占近50%
阿里巴巴官方宣布正式启动了2026届春季实习生招聘,开放的岗位总数超过3000个,其中与人工智能(AI)相关的岗位占比近50%。 在某些业务部门,AI 岗位的比例更为显著,比如高德达到了约65%,而阿里云则超过了80%。 这一变化反映出阿里巴巴对 AI 技术的重视程度正在加大。
Regie.ai:用AI增强销售能力,重视人性化的销售沟通
在现代商业环境中,销售团队需要各种资源来帮助他们成功达成交易。 然而,销售能力的提升并没有统一的标准。 有些团队在寻找潜在客户方面表现不佳,而另一些团队则需要支持来完成交易。
亚马逊推出升级版Alexa+ 能读懂和总结长文档
在亚马逊年度设备与服务活动上,亚马逊正式推出了其增强版语音助手 Alexa 。 这一新版本不仅提升了语音交互体验,还融入了生成式人工智能技术,让用户与 Alexa 之间的互动更加智能和便捷。 在活动中,亚马逊演示了如何将文档分享给 Alexa ,使其能够提取关键信息并回答关于这些文档的问题。
李开复:AI时代会让每个APP都比人更聪明
今日,零一万物CEO、创新工场董事长李开复在国联民生证券首届资本市场峰会上发表了主题演讲。 他在演讲中指出,2025年会是AI应用大规模落地的元年。 图源备注:图片由AI生成,图片授权服务商Midjourney相较云计算,预计AI2.0应用层的爆发周期将缩短到两年内。
字节跳动AI智能助手豆包APP推出“照片动起来”功能
近日,字节跳动旗下的AI智能助手豆包APP宣布了一项创新功能——“照片动起来”。 这一功能的推出,旨在满足用户对于老照片动态化的需求,让那些曾经定格的瞬间重新焕发生机。 据悉,“照片动起来”功能操作简便,用户只需打开豆包APP,选择该功能并上传一张老照片,随后描述照片中人物或物体的动作。
研究多模态?快来申报这个基金
2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布 “CCF - 阿里妈妈科技袋基金” 第二期,共十个课题,聚焦多模态智能方向,申报截止时间:2025 年 3 月 26 日 24:00(北京时间),欢迎 CCF 会员积极申报。 2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布「CCF - 阿里妈妈科技袋基金」第二期,聚焦在「多模态智能方向」展开研究,涵盖多模态推荐系统的递进式算法创新研究、基于多模态信息的用户意图识别、多模态中文广告海报制作、多模态视频创意制作等四个子方向,共十个课题。 申报截止时间:2025 年 3 月 26 日 24:00(北京时间),欢迎 CCF 会员积极申报。
DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
实现顶级 AI 性能的秘诀,就在这里了。 DeepSeek 的开源周已经进行到了第四天(前三天报道见文末「相关阅读」)。 今天这家公司一口气发布了两个工具和一个数据集:DualPipe、EPLB 以及来自训练和推理框架的分析数据。
夏威夷大学与谷歌联手推出免费人工智能培训计划
近日,夏威夷大学宣布与谷歌合作,为其全州10个校区的学生和员工提供免费的人工智能培训课程。 这一计划将为参与者打开通向职业发展的新大门,特别是在网络安全、数据分析和信息技术支持等热门领域。 通过这一合作,夏威夷大学的学生可以免费获得谷歌职业证书项目的入场券。
Anthropic 全面开放 Claude AI 的 GitHub 集成,赋能所有开发者
Anthropic 的 Claude 宣布面向所有用户开放 GitHub 集成,此前该功能仅限企业版用户。集成后,Claude 能理解代码库上下文,帮助测试、调试代码。免费用户需注意配额消耗,Pro 用户则更易控制。这是继 Google Drive 集成后,Claude 为开发者提供的又一重要功能。 #Claude #GitHub集成 #开发者工具
亚马逊推出全新智能助手 Alexa+,语音指令执行餐馆预订等任务
亚马逊宣布推出全新的智能助手 Alexa ,这一升级版的数字助理引入了生成式人工智能技术,提升了对话的自然流畅度和智能化水平。 Alexa 不仅能记住用户的偏好,还具备强大的多平台操作能力,让用户的日常任务更加轻松便捷。 Alexa 将于下个月在美国进行早期访问,亚马逊 Prime 会员可以免费使用,而非会员则需支付19.99美元。
调查显示超八成美国职场人士尚未应用人工智能
根据最新调查显示,大多数美国上班族仍未在工作中使用 AI。 皮尤研究中心于本周二发布的调查结果显示,只有约16% 的美国上班族表示会利用 AI 来完成至少一部分工作。 相较之下,约81% 的受访者被视为 “非 AI 用户”。
发布在即?OpenAI GPT-4.5出现在Android应用测试版
最近,OpenAI 正在为其新一代语言模型 GPT-4.5的预览版做准备,这一消息引发了广泛关注。 根据发现,这一开发成果出现在 ChatGPT 的 Android 应用程序中,作为一个已宣布的实验性选项,尽管目前还无法访问。 根据最新通知,GPT-4.5最初将专门向 Pro 订阅用户提供。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉