应用
Light-A-Video :无需训练实现视频重新打光
近年来,图像重光照技术的进步得益于大规模数据集和预训练的扩散模型,使得一致性光照的应用变得更加普遍。 然而,在视频重光照领域,由于训练成本高昂以及缺乏多样化和高质量的视频重光照数据集,进展相对缓慢。 仅仅将图像重光照模型逐帧应用于视频,会导致多种问题,如光源不一致和重光照外观不一致,最终导致生成的视频出现闪烁现象。
香港大学研发 AI 成像工具CytoMAD 提升癌症检测速度与精准度
香港大学(HKU)的研究团队近日宣布,他们成功开发出一款基于人工智能的成像工具,旨在提升癌症诊断的速度和准确性。 这项名为 “细胞形态对抗蒸馏”(CytoMAD)的新技术,由工程学院的齐凯文教授领导,利用生成式人工智能的方法进行精确的单细胞分析,且无需传统的标记技术。 CytoMAD 的技术经过香港大学李嘉诚医学院及玛丽医院的合作测试,已在肺癌患者的评估中表现出良好的效果,并且能支持药物筛选过程。
FDA 大裁员:AI 部门受重创,特朗普却在加码投资!
在最近的一次裁员中,美国食品药品监督管理局(FDA)的人工智能(AI)和数字健康团队遭遇了重创。 这一决定引发了广泛的担忧,因为在当前医疗行业对 AI 技术日益依赖的背景下,监管机构亟需密切关注医院和保险公司如何应用这些新兴技术。 图源备注:图片由AI生成,图片授权服务商Midjourney近年来,AI 在医疗保健领域的使用不断增加,医生们开始运用这一技术来更有效地检测疾病,制定治疗方案。
华为推出 DeepSeek 训 / 推超融合一体机,适配 V3&R1 及蒸馏模型
华为 DCS AI 解决方案针对 DeepSeek 推出 FusionCube A3000 训 / 推超融合一体机,适配 DeepSeek V3&R1 及蒸馏模型,支持私有化部署。
Meta 出品!Pippo:输入单张人物图片生高分辨率多视角图片
近日,Meta Reality Labs 的研究团队联合高效发布了一项名为 “Pippo” 的创新性生成模型,能够从一张随意拍摄的照片中,生成一段高达1K 分辨率的密集周转视频。 这一突破性技术,标志着计算机视觉和图像生成领域的又一重要进展。 Pippo 模型的核心在于其多视图扩散转换器的设计。
微软发布 OmniParser V2.0:把屏幕截图转化成LLM可处理的结构化格式
微软近日发布了 OmniParser V2.0,这是一个旨在将用户界面(UI)截图转换为结构化格式的全新解析工具。 OmniParser 能够提高基于大型语言模型(LLM)的 UI 代理的性能,帮助用户更好地理解和操作屏幕上的信息。 该工具的训练数据集包括一个可交互图标检测数据集,该数据集从热门网页中精心挑选并自动注释,以突出可点击和可操作的区域。
OpenAI调整策略,力求在内容审查与自由言论之间找到平衡
OpenAI 近期宣布了一项重要的政策更新,旨在改变其人工智能模型的训练方式,强调 “知识自由” 的重要性,无论话题多么具有挑战性或争议性。 这一变化意味着,ChatGPT 将能更全面地回答问题,提供更多视角,减少拒绝讨论某些话题的情况。 在新的187页模型规范中,OpenAI 提出了一个新的指导原则:不要撒谎,既不要发表不真实的陈述,也不要省略重要的上下文。
苹果与Meta争相开发AI驱动的人形机器人
在科技界的舞台上,苹果与 Meta 这两大巨头正在悄然展开一场关于 AI 驱动的人形机器人的竞赛。 尽管这两家公司在某些领域存在竞争,但此次合作与对抗的交织,或许将开启科技的新篇章。 苹果作为消费者电子产品的先锋,其在智能硬件领域的创新能力毋庸置疑。
阿里巴巴在AI热潮中逆风翻盘,股价上涨50%
阿里巴巴集团控股有限公司(NYSE:BABA)近期股价飙升超过50%,这主要得益于投资者对 AI(人工智能)发展的乐观预期。 尽管由于核心零售业务的增长乏力以及中国的地缘政治风险,阿里巴巴的估值一直处于低位,但这并没有阻止其股价的强劲反弹。 市场普遍认为,阿里巴巴正经历从零售主导向 AI 创新的战略转型,且其资本支出增长正不断加速。
Meta 创新推出 “连续概念混合” 框架,推动 Transformer 预训练新革命
近年来,随着大型语言模型(LLMs)的快速发展,自然语言处理领域经历了前所未有的变革。 这些技术如今广泛应用于代码助手、搜索引擎和个人 AI 助手等场景,展现了强大的能力。 然而,传统的 “下一个 token 预测” 范式存在一定局限性,尤其是在处理复杂推理和长期任务时,模型需要经历大量训练才能掌握深层次的概念理解。
UI设计神器!Ready AI:输入提示词即可生成专业级网页
最近,一款名为Ready AI的工具正在设计圈引起不少关注。 这款工具的优秀之处在于用户仅需输入文字指令,就能在30秒内生成专业级网页界面。 使用 Ready AI,用户对自己想要的 UI 有更多控制权。
马斯克即将发布Grok3,称其为 “全球最聪明的人工智能”
科技巨头埃隆・马斯克(Elon Musk)领导的人工智能初创公司 xAI,计划于2月17日晚上8点(太平洋时间)发布其最新的聊天机器人 Grok3。 马斯克称 Grok3为 “地球上最聪明的人工智能”,其发布正值人工智能大模型竞争日益激烈的背景下。 Grok3的模型基于合成数据进行训练,具备通过反复审视数据实现逻辑一致性的能力,能够反思和纠正自身错误。
DeepSeek 关联公司高层变动,经营范围新增互联网信息服务
天眼查 App 显示,DeepSeek 关联公司杭州深度求索人工智能基础技术研究有限公司近日发生多项工商变更。 裴湉卸任执行董事兼总经理,改任经理、董事;新增王贤祖为财务负责人;公司经营范围新增互联网信息服务。 该公司成立于2023年7月,法定代表人为裴湉,注册资本1000万人民币,由梁文锋及其名下宁波程恩企业管理咨询合伙企业(有限合伙)共同持股。
腾讯文档正式接入DeepSeek-R1满血版
2月17日,腾讯文档宣布正式接入DeepSeek-R1模型满血版,进一步提升用户在文档创作、信息处理和协作编辑中的效率。 此次接入的DeepSeek-R1模型具备深度思考、联网搜索、多轮对话等功能,能够为用户提供更全面、专业和高效的内容生成与处理体验。 用户在腾讯文档的AI文档助手中选择DeepSeek-R1模型后,即可在腾讯文档小程序、网页版、移动端和桌面端(支持3.9.5及以上版本)体验该功能。
DeepSeek大模型引领AI教育产品商业化 助力教育降本增效
在当今时代,人工智能(AI)正迅速融入各个行业,而教育领域无疑是其应用的核心场景之一。 AI 技术的崛起为教育提供了降本增效的新机遇,使得高质量、普惠性和个性化的教育成为可能。 近期,多家教育公司接入了 DeepSeek 大模型,这标志着 AI 教育产品的商业化进程正在加速。
AI 新突破:扭矩聚类算法亮相,无需人工标注、自主学习准确率高达 97.7%
科技媒体 scitechdaily 昨日(2 月 16 日)发布博文,报道称悉尼科技大学的研究人员开发了一种名为“扭矩聚类”(Torque Clustering)的全新 AI 算法,不需要人工干预,可以极大提升 AI 系统自主学习和识别数据模式的能力。
开发者狂喜!字节AI编程工具Trae正式发布Win x64 版本
在众多用户的期待中,字节AI编程工具Trae官方正式宣布现已支持 Win x64版本,并强调这次更新将为 Win x64用户带来更为流畅的操作体验。 Trae 作为一款适应性强的 AI 集成开发环境(IDE),正迅速成为开发者们的理想选择。 它不仅能够与用户无缝协作,还能大幅提升工作效率,让开发过程变得更加轻松愉快。
开发者,找找找丨300w呼唤天才的你
话说天下AI大势,天才辈出,智星云集。 人工智能如繁星,照亮智慧的苍穹。 人才如春风,吹动创新的号角。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉