乌金体藏文古籍文档分析与识别
"如何让计算机读懂深奥的藏文古籍,让藏文历史文献“长条书”的文档图像转为可编辑的内码藏文?所涉及的理论、方法和技术,《乌金体藏文古籍文档分析与识别》将给予全面解答。 "

作者:王维兰

丛书名:图像图形智能处理理论与技术前沿

定价:85元

印次:1-1

ISBN:9787302676324

出版日期:2024.12.01

印刷日期:2024.12.27

图书责编:刘杨

图书分类:学术专著

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

" 本书就乌金体藏文古籍文档图像分析与识别进行研究,全面、系统和深入地开展乌金体藏文古籍文档图像的预处理、版面分割、文本行切分、字符切分、文本识别、后处理、版面描述与复原的理论与方法,以及解决乌金体藏文古籍版面有污渍、边框、模糊,以及行之间的笔画粘连、行内字符之间的粘连等复杂现象中关键问题的算法和实践。 本书的特色是从具体乌金体藏文古籍识别的应用研究出发,利用已有的相关理论,结合具体问题,开展诸如文档图像二值化、行切分、字符切分等相关研究的数据集建设,以及对针对各种问题提出解决方案和有效算法,并进行实验分析等。使读者从理论、方法和实践有一个全面的认识和了解,并从中获得有意的启发。 本书可以作为相关专业研究生的参考书,以及从事模式识别、图像处理、OCR、文档图像分析与识别、古籍文档图像分析与识别等计算机信息处理研究的科研人员和从事产品开发的工程技术人员阅读和参考。 "

王维兰,女,西北民族大学二级教授、博导。曾在中山大学、清华大学和美国印地安那大学做访问学者。从事图像处理与模式识别、藏文信息处理等方面的教学与研究工作。先后主持国家自然基金项目5项、省部级科研项目7项;获授权发明专利8项,发表包括SCI、EI等学术论文120余篇;获甘肃省科技进步二等奖2项、作为参与人获国家科技进步二等奖2项,以及甘肃省高校科技奖、兰州市科技奖多项。中国计算机学会高级会员、中国图象图形学学会高级会员、文档图像分析与识别专委会常务委员。曾获甘肃省“青年教师成才奖”荣誉称号;2006年评为“甘肃省优秀专家”;入选2014年“国家民委领军人才支持计划人选”;作为带头人,入选2018年国家民委“少数民族数字媒体智能信息处理及应用创新团队”支持计划团队。在“图像处理与模式识别”、“智能信息处理与应用软件”等方向招生硕士研究生,在中国语言文学的语言与应用语言学方向招生博士研究生。为第十、十一、十二届甘肃省政协委员。

前言 乌金体藏文古籍文档分析与识别是模式识别在藏文识别特别是乌金体藏文古籍文档图像分析与识别中的应用研究,是在国家自然科学基金面上项目: 乌金体藏文古籍文档分析与识别研究(编号: 61772430,时间: 2018—2021)、国家民族事务委员会科研创新团队项目: 少数民族数字媒体智能处理及应用创新团队(编号: 〔2018〕98号,时间: 2018—2022),以及西北民族大学相关科研项目的支持下所做的工作。 作者所在的西北民族大学数学与计算机科学学院的文化遗产数字化保护研究团队,一直从事藏文识别和智能输入方面的研究。在藏文键盘输入、联机手写藏文识别、印刷体藏文识别方面取得系列成果,为乌金体藏文古籍识别的探索奠定了良好的基础。从各种数据库建设、文档图像预处理、版面分析、行切分、字切分到识别等,先后有十多位研究生投入这项工作,本书以北京版的《甘珠尔》为主要样本来源,相关研究过程和成果汇集成本书。 全书包括8章,各章内容如下: 第1章绪论,主要介绍藏文古籍文档来源、文档特点、文字结构,以及不同粒度为识别单位的情况介绍,并对有文本文件的丽江版《甘珠尔》古籍进行了字丁和音节的统计。 第2章乌金体藏文古籍分析与识别样本库建设,包括文档预处理、版面分析、行切分、字符样本等数据集。该章包括了李振江、王轶群、韩跃辉和胡鹏飞等同学的工作贡献。 第3章藏文古籍文档图像的预处理,根据藏文古籍版面情况,介绍针对藏文古籍文档图像褪化的一些预处理方法。内容包括了韩跃辉、李振江、王轶群、赵鹏海、卢玉琪和赵庆华同学的相关工作。 第4章乌金体藏文古籍文档图像版面分析,...

目录
荐语
查看详情 查看详情
目录

第1章绪论

1.1引言

1.2藏文古籍文档分析与识别研究的背景及意义

1.2.1研究背景 

1.2.2研究意义

1.3乌金体藏文古籍文档分析与识别研究内容 

1.4乌金体藏文及其结构特征

1.4.1藏文文字特点

1.4.2藏文音节

1.4.3梵音藏文

1.4.4藏文梵音藏文的部件

1.5藏文古籍字频统计

1.5.1字丁统计

1.5.2音节统计

1.6当前的研究现状以及发展趋势

1.6.1藏文识别技术

1.6.2藏文古籍文档识别

1.6.3藏文古籍数字化资源

1.7关于本书

参考文献

第2章乌金体藏文古籍分析与识别样本库建设

2.1引言

2.2乌金体藏文古籍分析与识别样本库建设进展

2.2.1识别字符集样本库的研究现状

2.2.2藏文梵音藏文识别研究现状 

2.3乌金体藏文古籍样本库

2.3.1原始文档图像样本集

2.3.2古籍文档图像二值化样本集 

2.4乌金体藏文古籍分析与识别样本组成

2.4.1版面分析样本库

2.4.2文本行、文本串样本库

2.4.3字丁样本库

2.5本章小结

参考文献

第3章藏文古籍文档图像的预处理

3.1引言

3.2藏文古籍文档图像预处理研究进展

3.2.1图像增强现状

3.2.2扭曲矫正现状

3.2.3文档图像二值化现状

3.3藏文古籍文档图像增强

3.3.1滤波器的方法

3.3.2视觉感知的方法

3.3.3亮度提升和均衡化的方法

3.3.4低照度古籍文档图像增强方法

3.3.5超分辨率古籍文档图像增强方法 

3.4乌金体藏文古籍文... 查看详情

本书从具体乌金体藏文古籍识别的应用研究出发,开展诸如文档图像二值化、行切分、字符切分等相关研究的数据集建设,以及对针对各种问题提出解决方案和有效算法,并进行实验分析等。

查看详情