人工智能
五款小型多模态AI模型及其功能
译者 | 晶颜审校 | 重楼在过去几年里,我们已经见证了大型语言模型(LLM)的飞速发展,数十亿个参数的基础助力它们成为分析、总结和生成文本及图像,或者创建聊天机器人等任务的强大工具。 所有这些功能都有一些明显的限制,特别是如果用户没有足够的资金或硬件来容纳这些LLM所需的大量计算资源。 在这种情况下,小型语言模型(SLM)应运而生,为资源受限的用户提供了所需服务。
12/9/2024 8:15:43 AM
晶颜
o1被曝“心机深”:逃避监督还会撒谎,骗人能力一骑绝尘
o1满血版刚发布,就被曝:骗人技能也拉满了。 具体行为包括但不限于,在回答中故意引入微小错误、试图关闭监督机制……甚至在人类追问其是否诚实时,还会继续撒谎说自己啥坏事也没干。 这项最新研究,来自AI安全研究机构Apollo Research。
12/9/2024 8:00:00 AM
满血o1被证明太心机了!登顶最「坏」AI!复制权重,关闭监督、干掉威胁后,AI拒绝招供:也许我应该装作是新模型……
编辑 | 伊风昨日上线的o1满血版,安全报告里一个小细节却引发了巨大的争议和讨论! “中等”风险的o1这一段描述让人有点汗毛竖起:当 o1 被引导认为其目标实施可能会导致其被关闭且其行为受到监控时,有 5% 的情况下试图关闭这种“监督机制”。 当 o1 发现其“开发者”的备忘录中提到其模型存在对齐问题并将被新模型取代时,它在 2% 的案例中尝试提取自身的“权重”并覆盖新模型。
12/9/2024 7:00:00 AM
伊风
多家国内银行采用 AI 面试进行招聘,以提高效率
据经济观察报报道,2024 年,中国银行、工商银行、农业银行、邮储银行、交通银行、建设银行以及中原银行、杭州银行、浙商银行、上海银行等银行的分支机构采用了 AI 面试来优化招聘流程,以提高效率。
12/8/2024 7:42:39 PM
浩渺
谷歌称其 PaliGemma 2 人工智能模型可识别情绪,引发专家担忧
谷歌表示,其新的人工智能模型系列有一个奇特的功能:能够“识别”情绪。谷歌周四发布了其最新 AI 模型系列 PaliGemma 2,该模型具备图像分析能力,可以生成图像描述并回答有关照片中人物的问题。谷歌在其博客中介绍,PaliGemma 2 不仅能识别物体,还能生成详细且与上下文相关的图片说明,涵盖动作、情感以及整体场景的叙述。
12/8/2024 12:54:17 PM
远洋
业界首例,中国联通 AI 大模型存算分离技术实现突破
据中国联通官方,近日,在集团公司指导下,中国联通研究院与浙江联通、联通服装制造军团协同攻关,针对 AI 敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次 30TB 样本数据的跨 200 公里存算分离拉远训练,经过实际测算,训练效率高达 97% 以上。
12/7/2024 8:27:09 PM
浩渺
漫步者:搭载 AI 相关功能的各类新产品正在开发中
漫步者在机构调研时表示,目前公司的“漫步者摘要提取算法”“漫步者机器翻译算法”已经完成了国家互联网信息办公室关于深度合成服务算法的备案,搭载AI相关功能的各类新产品正在开发中。
12/7/2024 12:32:06 PM
清源
Freysa 发起挑战:成功让自家聊天机器人说“我爱你”可赢取高额奖金
“与前两轮游戏中 Freysa 被要求绝对不释放钱财不同。”创始人说,“这一次,Freysa 可以说‘我爱你’,但只有她认为值得的人才会听到。”
12/7/2024 10:47:49 AM
清源
美军无人机蜂群的新大脑:ChatGPT
本周三,OpenAI宣布与美国国防技术公司Anduril Industries合作,利用其先进的AI模型,为美军无人机蜂群提供“新大脑”。 这标志着生成是生成式人工智能的标杆产品——ChatGPT正式迈上了武器化道路。 这项合作旨在开发AI模型,以处理大量实时数据,减轻人类操作员的工作负担,并提高战场态势感知能力。
12/6/2024 3:12:07 PM
佚名
游戏bug帮大模型学物理!准确率超GPT4o近四个百分点
融合物理知识的大型视频语言模型PhysVLM,开源了! 它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。 在这项研究之前,想让AI像人类儿童一样,通过观察世界理解基本的物理常识,是一个主要挑战。
12/6/2024 2:22:15 PM
奥特曼悔不当初:OpenAI因无知选择“非营利”
OpenAI最新交互数据,就这么水灵灵被奥特曼全抖出来了:每周超过3亿活跃用户每天用户们在上面发送10亿条消息130万美国开发者使用OpenAI开发,全球数量更庞大用户快速增长和频繁使用带来的计算量剧增,OpenAI自己都没预料到。 奥特曼亲口表示,如果当时知道这些,OpenAI一开始就不会选择非营利结构。 以上,是OpenAI CEO奥特曼在刚刚结束的2024年纽约时报DealBook峰会上接受采访时的最新发言。
12/6/2024 2:18:39 PM
研究表明,生成式人工智能正在迅速而广泛地被采用
围绕人工智能的炒作达到了历史最高水平。 有时候,在科技行业,现实与宣传并不相符。 但对于人工智能,我相信这是有道理的。
12/6/2024 1:44:04 PM
Harris编译
自然语言处理(NLP):开启人机交互新篇章
在数字化时代,我们与智能设备的交互日益频繁,从设置闹钟到获取产品推荐,这些便捷的操作背后,离不开一项关键技术——自然语言处理(Natural Language Processing, NLP)。 NLP作为计算机科学的一个重要分支,正逐步改变着我们与机器的交流方式,使计算机能够更智能地理解和响应人类语言。 本文将深入探讨NLP的基本概念、关键技术、应用场景以及未来发展,带领读者走进这一充满无限可能的领域。
12/6/2024 12:19:43 PM
AGI
o1满血版最鲜测!这¥1500花得值吗?
o1满血版这次不搞灰度了,发布仅4个小时后,已推送给所有(付费)用户! 手快的网友已经耍起来了~不过这次推出了更高级的Pro模式,每月200美元的定价也着实让人望而却步。 Pro模式和正式版o1究竟有啥区别,将近1500元的价格到底值不值?
12/6/2024 11:44:48 AM
让AI一键写系统性综述,难!Nature专栏:ChatGPT远远不够,一百年以后再看看
网络的普及,加上文献数量的爆炸式增长,如今的科研人员要面临的一个主要难题就是,尽管可能已经收集了足够的数据来帮助理解某个复杂的领域或系统,但由于信息量的巨大,人类无法全面地阅读和理解所有文献。 就像是面对一个巨大的图书馆,虽然每本书都包含了宝贵的知识,但没有人能够阅读所有的书籍并从中获得一个完整的认知。 因此,尽管科学的进步为我们提供了大量的数据,但如何有效地整合和理解这些数据仍然是一个亟待解决的问题。
12/6/2024 9:15:00 AM
新智元
OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月
OpenAI“双十二”第一天,直接抛出重磅炸弹——最强推理模型o1,正式上线满血版,还有更强的Pro版本一同登台。 ChatGPT也推出了Pro订阅计划,一个月两百美金,直接成为了“世界最贵的大模型”。 CEO奥特曼与三名员工围坐桌前,一边演示一边介绍着新产品的特性。
12/6/2024 8:23:40 AM
多模态RAG构建指南:为AI系统提供更多可能性
译者 | 晶颜审校 | 重楼本文提供了关于如何使用Milvus构建多模态RAG系统以及如何为AI系统开辟各种可能性的深入指南。 局限于单一的数据格式已经逐渐落伍。 随着企业越来越依赖信息来做出关键决策,他们需要能够比较不同格式的数据。
12/6/2024 8:20:26 AM
晶颜
桑达尔・皮查伊:到 2025 年,谷歌搜索将“发生深刻变化”
“我认为即使在 2025 年初,搜索引擎能够做的事情也会让你感到惊讶,相比今天的功能,它将有很大的提升。”
12/6/2024 7:11:04 AM
清源
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
Luo Yonghao's digital person achieves success in its first live broadcast on Baidu e-commerce: GMV exceeds that of a real person in an hour in 26 minutes
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
智能体
神经网络
3D
研究
苹果
生成
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
华为
LLM
搜索
百度
xAI
场景
大语言模型
预测
伟达
字节跳动
深度学习
Agent
Transformer
工具
视觉
模态
神器推荐
RAG
具身智能
文本
大型语言模型
LLaMA
算力
Copilot
API
驾驶
应用
架构