图像生成

图像生成

文章,https,arxiv.org,pdf,2404.02790.pdf数据集,​​​https,MuLAn,dataset.github.io,​​文本到图像生成曾经取得了令人惊讶的成绩,但准确的空间可控性和prompt的保真度依然是极......
萌子哥 11-15
918 570 453
AI Agent AI运行落地关键技术

AI Agent AI运行落地关键技术

一、什么是AIAgent,1、用快思索与慢思索类比大模型的才干依据丹尼尔·卡尼曼的著述,思索,快与慢,,人类的思想可以分为两大系统,系统1和系统2,系统1担任直觉式的极速思索,这种思索往往是无看法的;而系统2则长于启动无看法的逻辑推理和被动......
萌子哥 11-15
408 425 750
Next

Next

作者,FrankWittkampf编译,岳扬AIAgents之间往往存在很大差异,配图源自MidJ01内容简介IntroductionAIAgents的行为关键由两点选择,1,它所运转的基础模型,以及,2,输入给该模型的高低文信息,高低文信......
萌子哥 11-15
169 511 419
反派新架构掀翻Transformer!有限高低文处置 2万亿token碾压Llama 2

反派新架构掀翻Transformer!有限高低文处置 2万亿token碾压Llama 2

继Mamba之后,又一勇于应战Transformer的架构降生了!来自Meta、南加州大学,USC,、CMU和UCSD的钻研人员提出了全新的神经网络架构——Megalodon,巨齿鲨,这是专为有效处置,有限高低文,长度的LLM预训练,以及推......
萌子哥 11-15
620 512 470
基于开源AI数据框架LlamaIndex构建高低文增强型LLA运行

基于开源AI数据框架LlamaIndex构建高低文增强型LLA运行

译者,朱先忠审校,重楼引言,将你的企业数据转化为可用于实践消费环境的LLM运行程序,,​​LlamaIndex主页​​​用60号字体这样高亮显示,其副题目是,LlamaIndex是构建LLM运行程序的上游数据框架,我不太确定它能否是业内上游......
萌子哥 11-15
876 648 202
Transformers学习高低文强化学习的时期差分方法

Transformers学习高低文强化学习的时期差分方法

高低文学习指的是模型在推断时学习才干,而不须要调整其参数,模型,例如transformers,的输入包括高低文,即实例,标签对,和查问实例,即提醒,而后,模型能够依据高低文在推断时期为查问实例输入一个标签,高低文学习的一个或者解释是,,线性......
萌子哥 11-15
984 379 532
间接裁减到有限长 谷歌Infini

间接裁减到有限长 谷歌Infini

谷歌又加大招了,颁布下一代Transformer模型Infini,Transformer,Infini,Transformer引入了一种有效的方法,可以将基于Transformer的大型言语模型,LLM,裁减到有限长输入,而不参与内存和计算......
萌子哥 11-15
359 126 664
高效RAG高低文紧缩方法COCOM 优化5.69倍

高效RAG高低文紧缩方法COCOM 优化5.69倍

GPT,4、Llama等开闭大模型经过预训练的方式将海量数据积攒成一个庞大的常识库,再经过文本问答的方式为用户生成各种内容,但这种方法仅局限于训练数据集,为了扩展输入范畴准许模型经过检索额外的数据来丰盛生成内容,RAG,常识检索增强,成为了......
萌子哥 11-15
432 136 326
港中文提出CLongEval中文基准测试集 准确评价大模型长高低文才干

港中文提出CLongEval中文基准测试集 准确评价大模型长高低文才干

论文标题,ClongEval,AChineseBenchmarkforEvaluatingLong,ContextLargeLanguageModels论文地址,​​https,arxiv.org,abs,2403.03514​​代码地址,......
萌子哥 11-15
509 281 514
ICML 2024

ICML 2024

本文作者李宏康,美国伦斯勒理工大学电气、计算机与系统工程系在读博士生,本科毕业于中国迷信技术大学,钻研方向包含深度学习实践,大言语模型实践,统计机器学习等等,目前已在ICLR,ICML,Neurips等AI顶会宣布多篇论文,高低文学习,in......
萌子哥 11-15
420 381 863