|
|
|
|
|
所属分类: |
计算机及信息技术 |
项目来源: |
自创 |
技术持有方姓名: |
北京市清华大学 |
所在地域: |
北京 |
是否中介: |
否 |
是否重点项目: |
否 |
技术简介: |
近年来,随着通讯技术以及网络技术的飞速发展,电子图书馆的概念就被提了出来。既然是图书馆,就不仅仅只是将现代出版的电子图书进行收藏。然而,要将浩瀚的印刷品由人工重新排版输入到计算机是不可想象的事情。把图书通过扫描仪器直接输入到计算机,以图象格式进行存储是不可取的,其数据量巨大,占用大量的空间。此外,也不利于在网上传输。为此,我们结合为美国方面工作经验,开发了图书电子化转换系统。该系统可以将整本杂志、书刊经高速双面扫描仪输入到计算机,然后由计算机对版面自动分割,将版面按图形、图象、文本进行划分,然后分别进行处理如压缩、OCR等,最后再将它们按区域坐标合成文件,从而使数据量减少几十乃至几百倍。对印刷版面自动分割,A4版面分割时间为10秒(奔腾100微机)。版面分割后被分为文本、图象、图形区。文本有OCR识别,图象图形分别由JPEG、小波、JBIG等算法压缩,最后的版面数据量可减少几倍到数十倍。 |
|
|
|
|
设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明
Copyriht 2007 - 2008 © 科普之友 All right reserved |