序列
全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!
元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。全球主流长文本大模型图谱 参数量和高质量数据量决定了大模型的计算复杂度,而长文本技术(Long Context)是大模型应用发展“杀手锏”,因技术新、研发难度高,目前多为闭源付费提供。 XVERSE-Long-256K支持超长文本输入,可用于大规模数据分析、多文档阅读理解
1/16/2024 3:52:00 PM
李亚洲
Protein BLAST会成为过去吗?AlphaFold等对蛋白结构的搜索是否会取代对序列的搜索
编辑 | 白菜叶像 AlphaFold 这样的蛋白质结构搜索工具会用 BLAST 取代蛋白质序列搜索吗?德累斯顿工业大学的研究团队讨论了使用结构搜索进行远程同源性检测的前景,以及为什么蛋白质 BLAST 作为领先的序列搜索工具应努力纳入结构信息。BLAST 广泛用于分子生物学中搜索核苷酸和蛋白质序列。BLAST 推出三十年后,结构预测出现了重大突破,出现了 RoseTTAFold 和 AlphaFold 等工具。因此,主要序列数据库中的每个蛋白质序列现在都带有一个 3D 折叠模型。虽然这不会影响(非编码)核苷酸序列
12/12/2023 11:52:00 AM
ScienceAI
ICCV 2023 | 重塑人体动作生成,融合扩散模型与检索策略的新范式ReMoDiffuse来了
来自南洋理工大学和商汤科技的研究者联合提出了一种全新的文本驱动动作生成框架——ReMoDiffuse。
9/27/2023 2:54:00 PM
MMLab
MIT研究人员将Transformer与图神经网络结合,用于设计全新蛋白质
编辑 | 萝卜皮凭借其复杂的排列和动态功能,蛋白质通过采用简单构建块的独特排列(其中几何形状是关键)来执行大量的生物任务。将这个几乎无限的排列库转化为各自的功能,可以方便研究人员设计用于特定用途的定制蛋白质。麻省理工学院(MIT)的 Markus Buehler 提出了一种灵活的基于语言模型的深度学习策略,将 Transformer 与图神经网络结合起来,以更好地理解和设计蛋白质。「通过这种新方法,我们可以通过对基本原理进行建模,利用大自然发明的一切作为知识基础。」Buehler 说,「该模型重新组合了这些自然构建
9/12/2023 6:02:00 PM
ScienceAI
想把半本《红楼梦》搬进ChatGPT输入框?先把这个问题解决掉
从 GPT-4 的 32k 到谷歌 CoLT5 的 64k 再到最新研究的 200万 token,类ChatGPT 模型们可以处理的文本长度正在急剧增加,这意味着它们的应用范围也越来越广。或许有一天,ChatGPT 能帮乔治·马丁把《冰与火之歌》(权力的游戏)写完呢?过去两年,斯坦福大学 Hazy Research 实验室一直在从事一项重要的工作:增加序列长度。 他们有一种观点:更长的序列将开启机器学习基础模型的新时代 —— 模型可以从更长的上下文、多种媒体源、复杂的演示等中学习。目前,这项研究已经取得了新进展。H
4/27/2023 3:11:00 PM
机器之心
用于抗体设计的深度生成蛋白语言模型
编辑 | 萝卜皮用于治疗应用的单克隆抗体的发现和优化依赖于大型序列库,但受到低溶解度、低热稳定性、高聚集和高免疫原性等可开发性问题的阻碍。在数百万个蛋白质序列上训练的生成语言模型是按需生成逼真、多样化序列的强大工具。约翰霍普金斯大学的科学家和工程师团队提出了免疫球蛋白语言模型 (IgLM),这是一种深度生成语言模型,用于通过重新设计可变长度的抗体序列跨度来创建合成库。IgLM 将抗体设计制定为基于自然语言文本填充的自回归序列生成任务。该团队在 558M 抗体重链和轻链可变序列上训练 IgLM,以每个序列的链类型和来
3/27/2023 3:57:00 PM
ScienceAI
CVPR 2021 | 时间序列疾病预测的因果隐马尔可夫模型
本文是对发表于计算机视觉和模式识别领域的顶级会议 CVPR 2021的论文“Causal Hidden Markov Model for Time Series Disease Forecasting(时间序列疾病预测的因果隐马尔可夫模型)”的解读。
该论文由北京大学王亦洲课题组与深睿医疗等单位合作,针对时间序列疾病预测的问题,提出了因果隐马尔可夫模型描述疾病的动态发展过程,并使用基于 VAE 的变分框架进行学习。通过对图像隐空间进行解耦,去除疾病无关因子与疾病预测的伪相关关系,从而提高预测的准确率和鲁棒性。
7/18/2022 5:03:00 PM
北京大学前沿计算研究中心
做时间序列预测有必要用深度学习吗?事实证明,梯度提升回归树媲美甚至超越多个DNN模型
在深度学习方法应用广泛的今天,所有领域是不是非它不可呢?其实未必,在时间序列预测任务上,简单的机器学习方法能够媲美甚至超越很多 DNN 模型。
3/6/2022 1:07:00 PM
机器之心
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果将 ChatGPT 和其他 AI 模型引入 Xcode
Grok接管推特算法!小号也能爆红,新人起号迎来黄金时代?
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构