近年来,以ChatGPT为代表的大言语模型如雨后春笋般涌现,成为AI畛域的焦点。在大言语模型的开发通常中,AI框架的选用至关关键。AI框架是AI算法模型设计、训练和验证的一套规范接口、个性库和工具包,集成了算法的封装、数据的调用以及计算资源的经常使用,同时面向开发者提供了开发界面和高效的口头平台。
昇思MindSpore作为华为开源的AI框架,在过去的几年里使能产业界、学术界基于昇思原生、适配支持超越50个大模型。开源4年多来,昇思MindSpore已成为国际AI大模型翻新的框架,原生支持大模型及AI+迷信计算才干,以多维混合散布式并行才干,优化超大模型的训练效率,并打造MindSpore TransFormers、MindSpore One生成式套件与MindSpore Science迷信默认套件,成功全流程开箱即用,大幅降落大模型全流程的开发门槛与老本。
基于此,《MindSpore大言语模型实战》一书应运而生,本书由昇思开源社区技术委员会委员陈雷教员联结昇思研发团队编写,活泼展现昇思MindSpore在使能大言语模型的翻新运行案例,为开发者极速上手昇思、开发大模型提供指点。
购书链接:
内容简介
本书旨在深度开掘大言语模型技术。首先,本书追溯大言语模型的开展历程,引见Transformer模型的基本原理、结构和模块及在大模型义务中的运行,并剖析它们在各畛域的成功案例,而后引见由Encoder-Only到Decoder-Only的技术路途开展环节中对应的BERT、GPT等大言语模型,深化了解它们面前的上班原理。经过通常引见,读者将对大言语模型的演进和打破有更为明晰的看法。
接着,本书重点深化开展昇思MindSpore撑持一众大模型的**:散布式并行才干,解析其在大言语模型通常中的共同之处,这将有助于读者片面了解昇思MindSpore在大言语模型通常中的翻新运行。
最后,本书以干流开源大言语模型BLOOM和LLaMA为样例,聚焦大言语模型在不同畛域的通常,包含人造言语解决、图像生成、语音识别等畛域。提醒MindSpore如何为这些畛域的大言语模型提供高效的支持,协助读者更好地将大言语模型运行于实践疑问。
必读理由
●紧跟热点: 以先人工默认最热的畛域是大言语模型,从业者对了解、经常使用及构建大言语模型充溢激情,本书以大言语模型畛域的运行为主,切合市场热点。
●实战为主: 全方位深度学习常识学习和高效的框架代码通常,协助开发者/在校生/从业者等极速了解并打造自己的大言语模型,本书适宜一切感兴味的人学习。
●模块化课程: 紧跟业界热点,拆解至小颗粒度启动分类,精准定位常识点,对症下药最大效率启动学习。
●专家指路: 作者陈雷在MindSpore人工默认框架深耕畛域多年,有丰盛的通常通常阅历,收到业内人士和开发者的宽泛认可。
●收费资源: 课程全程收费,并提供收费算力资源用于学习,可关注MindSpore群众号颁布的优惠;更多的大模型案例可关注昇思MindSpore技术地下课的继续降级。
作者简介
陈雷:加拿大滑铁卢大学计算机博士。现负责香港科技大学(广州)信息枢纽院长,数据迷信与剖析学域讲座传授,广州市大数据默认重点试验室主任。钻研方向包含数据驱动的人工默认、大数据剖析、常识图谱、众包、区块链、图数据库、概率和不确定数据库,以及时空和期间序列数据库。
曾获2020年度中国电子学会迷信技术奖一等奖、2年ACM SIGMOD期间检测奖2022 WLDB最佳钻研论文奖、2014LDB低劣示范奖。曾负责ICDE2023和VLDB2019 PC联结主席、VLDB Journal联结主编、VLDB基金会口头委员。目前负责IEEETKDE主编、DASFAA国际会议指点委员会主席、长江讲座传授,入选IEEE会士和ACM卓越迷信家,取得国度卓越青年迷信基金海外青年学者协作钻研名目支持。