T

T

AIAgent,自动体,作为大模型的关键运行形式,能够经过经常使用外部工具来执行复杂义务,成功多步骤的上班流程,为了能片面评价模型的工具经常使用才干,司南及协作同伴团队推出了T,Eval评测基准,关系成绩论文已被ACL2024主会录用,检查......
萌子哥 11-15
199 159 641
多模态与伪多模态大模型

多模态与伪多模态大模型

透过现象看实质,才是最应该做的选用,对大模型了解的人应该知道,大模型是由于openAI的GPT模型爆火的,当然大模型的开展也是经过多年的开展才有了当天的境地,在之前的文章中也引见过,大模型的全程是大规模预训练言语模型的简称,也就是说大模型刚......
萌子哥 11-15
680 483 561
多模态大模型最全综述导读

多模态大模型最全综述导读

多模态大模型最新钻研综述便捷版,不知道最近微软出的多模态大模型最全综述MultimodalFoundationModels,FromSpecialiststoGeneral,PurposeAssistants大家有没有看~蕴含5大主题一共1......
萌子哥 11-15
239 246 531
SOTA Movie 视频生成模型 新的 Meta Gen

SOTA Movie 视频生成模型 新的 Meta Gen

一、背景前段时期Meta颁布了对标OpenAISORA和快手可灵的视频生成模型MovieGen,这里咱们启动相关的技术解读,本文关键聚焦在其图像和视频生成模型局部,启动详细引见;而后对视频共性化、编辑和音频生成启动便捷概述,对应的论文,Mo......
萌子哥 11-15
396 389 327
多模态大模型的成功原理 以及技术难点

多模态大模型的成功原理 以及技术难点

多模态大模型的终点就是,人,,人就是最完美的多模态模型,多模态大模型是允许多种模态数据的深度学习模型,与之对应的是单模态模型;但由于单模态模型存在很多毛病,因此多模态大模型应运而生,人就是最完美的多模态模型,而大模型的开展方向也是让它越来越......
萌子哥 11-15
151 534 512
项义务测上去 Gemini等多模态大模型竟都没什么视觉感知才干 14 GPT4V

项义务测上去 Gemini等多模态大模型竟都没什么视觉感知才干 14 GPT4V

2023,2024年,以GPT,4V、Gemini、Claude、LLaVA为代表的多模态大模型,MultimodalLLMs,曾经在文本和图像等多模态内容处置方面体现出了绝后的才干,成为技术新浪潮,但是,关于这些模型的评测多集中于言语上的......
萌子哥 11-15
649 684 485
清华大学提出1

清华大学提出1

在深度神经网络的训练环节中,全量化训练,FullyQuantizedTraining,FQT,经过将激活值、权重和梯度量化到较低的精度,清楚减速了训练环节,随着对训练数值精度的始终紧缩,一个人造而然的疑问显现进去,全量化训练的极限是什么,即......
萌子哥 11-15
641 368 653
新架构训练效率大幅优化 2来了 再战Transformer!原作者带队的Mamba

新架构训练效率大幅优化 2来了 再战Transformer!原作者带队的Mamba

自2017年被提出以来,Transformer曾经成为AI大模型的干流架构,不时稳居言语建模方面C位,但随着模型规模的裁减和须要解决的序列不时变长,Transformer的局限性也逐渐凸显,一个很清楚的毛病是,Transformer模型中自......
萌子哥 11-15
746 400 738
LLM 优化大规模并行训练效率的方法

LLM 优化大规模并行训练效率的方法

一、论断写在前面论文来自阿里巴巴,论文题目,BoostingLarge,scaleParallelTrainingEfficiencywithC4,ACommunication,DrivenApproach论文链接,​​https,arxi......
萌子哥 11-15
549 263 220
Scaling Law 实时视频时代或将开启! 两步采样就出图 OpenAI上新sCM!生成速度优化50倍 再创奇观

Scaling Law 实时视频时代或将开启! 两步采样就出图 OpenAI上新sCM!生成速度优化50倍 再创奇观

传统分散模型要过期了,OpenAI找到一种新方法,间接把生成速度提高50倍!分散模型在生成式AI畛域的关键性显而易见,把生成真切的图像、3D模型、音频和视频变为了事实,然而,分散模型依然有个致命bug——采样速度太慢,OpenAI钻研的新方......
萌子哥 11-15
100 430 838