AI大模型系统开发技术
一书读懂大模型,了解大模型的很好的读物

作者:鞠时光,周从华,宋香梅,王秀红

丛书名:面向新工科专业建设计算机系列教材

定价:59元

印次:1-1

ISBN:9787302686088

出版日期:2025.05.01

印刷日期:2025.04.18

图书责编:杨帆

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"本书系统介绍行业AI大模型系统开发技术。全书共10章,主要内容包括AI大模型概述、AI基础算法、深度学习技术与工具、生成式模型、数据标注技术、注意力机制、Transformer架构解析、自然语言处理中的预训练模型、微调技术以及大语言模型系统安全技术。本书内容逻辑清晰、循序渐进,从理论到实践,从算法到工程实现,引导读者深入理解和逐步掌握行业AI大模型开发关键技术和方法。 本书适合作为高等学校理工科研究生、计算机相关专业高年级本科生相关专业课教材,也可供行业AI大模型系统开发人员参考。 "

鞠时光,1982年毕业于江苏大学计算机专业师资班,1988年取得南京理工大学计算机系硕士学位,1990年由国家教育部公派去墨西哥理工大学留学,于1996年取得墨西哥理工大学计算机系博士学位。从1982年开始一直在江苏大学计算机学院从事计算机专业的教学与科研工作,主持完成了4项国家自然科学基金项目,以及国家863,江苏省自然科学基金等多项重要科研项目。曾多次获得江苏省科技进步奖、机械部科技进步奖等。在国内外计算机杂志发表论文一百多篇。先后出版《对象关系型数据库管理系统的开发技术》、《操作系统》、《大比例尺地形图全自动绘制系统》等著作。曾任墨西哥理工大学教授, 江苏大学计算机学院教授、博士生导师、学院院长等。曾兼任中国计算机学会系统软件专业委员会委员、中国图像图形学会理事、中国电子学会理事、《通信学报》编委等

前言 人工智能(AI)的研究可以追溯到20世纪中叶,当时的研究者试图通过模拟人类智能解决问题。然而,早期的AI系统由于计算能力和数据的限制,功能较为有限。进入21世纪后,得益于计算能力的提升和大数据的广泛应用,机器学习尤其是深度学习迅速崛起。2012年,AlexNet在ImageNet大赛上取得的突破性成果标志着深度学习时代的到来。随后,谷歌、Facebook、微软等科技巨头相继投入大量资源,推动了AI技术的飞速发展,深刻地改变了人们生活的方方面面。无论是自动驾驶汽车、智能家居设备还是医疗诊断系统,AI的身影无处不在。 AI大模型的出现是AI发展中的一个里程碑。2018年,Google公司推出了BERT模型,它在多个自然语言处理任务上取得了前所未有的成绩。紧随其后,OpenAI公司发布了GPT系列模型,特别是大规模的参数和强大的生成能力,彻底改变了人们对AI的认知。这些大模型在工业界迅速得到应用,涵盖了从文本生成、翻译到编程辅助各个领域。 本书旨在引导读者深入理解和掌握AI大模型开发的关键技术和方法。本书从理论到实践,从算法到工程实现,全面介绍如何系统地构建高效、面向行业的AI大模型系统。本书可作为工科各专业研究生、高年级计算机相关专业本科生、工程师及相关技术开发人员学习AI大模型技术的教材或参考书。考虑非计算机专业的技术人员学习AI技术的需要,本书的第1章对AI大模型进行概要介绍。第2章对AI基础算法进行介绍。第3章对深度学习技术与工具进行介绍。第4~10章系统阐述行业大模型构建、开发相关技术以及预训练大模型的流程等。 本书的写作得到了许多人的帮助和支持...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章AI大模型概述1

1.1AI大模型的定义1

1.2AI大模型发展概况2

1.2.1语言模型演进3

1.2.2AI大模型家族4

1.2.3国内外AI大模型研究现状5

1.3AI大模型基础设施7

1.3.1计算资源8

1.3.2存储系统8

1.3.3网络带宽8

1.3.4AI算法和优化技术9

第2章AI基础算法10

2.1AI基础算法概述10

2.1.1基于集合论的算法10

2.1.2基于概率统计的算法12

2.1.3基于图论的算法14

2.1.4基于空间几何的算法17

2.1.5基于演化计算的算法17

2.1.6基于人工神经网络的算法19

2.2专家系统19

2.2.1专家系统的一般结构20

2.2.2专家系统的构建21

2.2.3专家系统的发展21

2.3机器学习25

2.4拟人机器学习30

2.4.1拟人机器学习的概念30

2.4.2拟人系统的瓶颈问题302.5人工情感计算30

2.5.1文本情感计算31

2.5.2语音情感计算32

2.5.3视觉情感计算33

第3章深度学习技术与工具35

3.1词向量模型35

3.1.1滑动窗口36

3.1.2Word2Vec模型36

3.1.3Word2Vec训练流程41

3.2卷积神经网络43

3.2.1卷积神经网络结构43

3.2.2卷积神经网络的特点46

3.2.3卷积神经网络在自然语言处理领域中的应用47

3.3循环神经网络48

3.3.1典型的循环神经网络单向传播48

3.3.2双向循环神经网络50

3.3.3深度循环神...

"本书通过严谨简明的预备知识介绍,有的放矢地为读者梳理AI大模型开发中涉及的数学知识。然后以自然语言处理、图像理解等实践中拟解决的问题为着眼点,将理解及开发面向行业的大模型系统要解决的问题转换为求解相关的模型。接着循序渐进地给出求解此模型的基础求解方法以及优化求解方法。
本书能够普惠更多希望学习人工智能大模型开发技术的工科研究生及计算机本科高年级学生及工程技术人员,让他们掌握大模型开发的方法并能应用于解决他们所从事的专业上所涉及的实际问题。同时,也可以让读者把人工智能技术的思维带到平时的学习和工作中,启发他们对本专业智能应用的思考与探索。
"