RecurrentGemma Google开源大模型新成员CodeGemma 继Transformer后新架构Griffin降生

RecurrentGemma Google开源大模型新成员CodeGemma 继Transformer后新架构Griffin降生

2024年2月,Google推出了Gemma,一系列轻量级、先进的开源大模型,这些模型是经常使用创立Gemini模型时所经常使用的相反钻研和技术构建的,近日,Google发表了Gemma家族的首批新增成员,为机器学习开发者裁减了翻新责任的或......
萌子哥 11-14
842 453 284
统永世物言语大模型阿里云先开了! AlphaFold 3不开源

统永世物言语大模型阿里云先开了! AlphaFold 3不开源

把169861个动物物种数据装进大模型,大模型竟get到了动物核心规律的微妙——不只能识别DNA、RNA与相应蛋白质之间的外在咨询,在基因分类、蛋白质相互作用预测、热稳固性预测等7种不同类型义务中也能比肩SOTA模型,模型名为,由阿里云飞天......
萌子哥 11-14
559 178 636
Open 卷疯了! LLM集中迸发的一周

Open 卷疯了! LLM集中迸发的一周

开源大模型畛域繁华特殊的一周,各种开源,PaperAgent启动了概括,端侧、Code、RAG、Agent、Reflection,反思纠正,、MoE,你关注的都在这里了,ReflectionLlama,3.1,70B开源Reflection......
萌子哥 11-14
679 496 859
开源的金融剖析工具 Llama3

开源的金融剖析工具 Llama3

在人造言语处置,NLP,畛域的继续提高中,大型言语模型,LLMs,的畛域顺应模型变得越来越关键,针对特定义务优化的模型能够提供明晰、繁复和正确的消息,这是商业和最终用户都须要的用例,从医疗诊断到法律咨询,再到金融剖析,LLMs正在逐渐扭转咱......
萌子哥 11-14
274 652 293
3 2 性能超Llama 可商用!开源大模型Falcon

3 2 性能超Llama 可商用!开源大模型Falcon

阿联酋,阿布扎比技术翻新钻研所,TII,在官方发表,开源全新大模型Falcon2,Falcon2有110亿参数共有两个版本,一个是高效、易于部署的基础模型,经常使用了5.5万亿tokens数据启动预训练,可以生成文本、代码、总结内容等,另外......
萌子哥 11-14
732 200 512
3.0秒杀同级别大模型 IBM重磅颁布Granite

3.0秒杀同级别大模型 IBM重磅颁布Granite

大模型畛域的开展突飞猛进,每天都有许多幽默的论文值得深化品读,上方是本期感觉比拟无心思的论文,1、大模型要断粮了,最新综述提醒AI数据困境与包围之道2、IBM重磅颁布Granite3.0,8B参数秒杀同级别大模型,还能随意商用!3、世界首个......
萌子哥 11-14
207 556 525
腾讯加大招 超Meta!史上参数最大 开源专家混合模型

腾讯加大招 超Meta!史上参数最大 开源专家混合模型

开源大模型畛域迎又来一位重磅玩家——腾讯,腾讯一出手就是个超大模型,开源的Hunyuan,Large是目前市面上最大基于Transformer架构的专家混合,MoE,模型,一共有3890亿参数,其中激活参数为520亿,具有解决长达256K高......
萌子哥 11-14
465 309 694
V2开源颁布 首超GPT4 DeepSeek Coder

V2开源颁布 首超GPT4 DeepSeek Coder

去年11月,最强开源代码模型DeepSeek,Coder亮相,鼎力推进开源代码模型开展,往年5月,最强开源MoE模型DeepSeek,V2颁布,悄悄引领模型结构翻新潮流,当天,环球首个在代码、数学才干上与GPT,4,Turbo争锋的模型,D......
萌子哥 11-14
863 216 207
11B和90B多模态模型 Meta颁布1B和3B端侧模型 Llama3.2开源

11B和90B多模态模型 Meta颁布1B和3B端侧模型 Llama3.2开源

早上起来发现,MetaAI又开源模型,文本模型开源了端侧小模型1B和3B模型,也是初次开源了多模态大模型11B和90B两个版本;同时还开源了一个LlamaStack名目,Blog,https,ai.meta.com,blog,llama,3......
萌子哥 11-14
249 116 607
将端侧大模型启动究竟

将端侧大模型启动究竟

面壁不时都在做端侧大模型,之前有文本系列MiniCPM,2B模型,还有多模态系列的MiniCPM,V系列模型,当天又开源了MiniCPM3,4B模型,真是端侧一路走到低,这次MiniCPM3,4B也是在成果上有了渺小的优化,超越Phi,3.......
萌子哥 11-14
825 265 773