避免纸介质问题环节 中海实业进入数字化领域
随着纸介质资料数字化技术的快速发展,科技资料数字化已成为一种新的国际趋势。数字化的科技资料具有图文并茂的优势,在网络日益普及的今天,可以使人们轻松地获得知识。加之数字化的科技资料更易于保存,因而更具有现实的应用意义。由于它的可复制和无纸化的优势,大大地提高了工作和学习的效率,有效避免了纸介质资料在传递各个环节中出现的问题,尤其对于大规模的科技资料的数字化处理,可大大降低管理的成本。
尤为重要的是,数字化的科技资料不受空间、时间等限制,能真正实现多方资源共享,人们可通过广域网和局域网实现跨时间、跨地域、跨国界的信息交流,随时发表自己的学术观点及意见、展开网上讨论,及时为科技资料提供最新的动态信息,既丰富了科技资料的内容又实现了人们的平等对话。而且,大多数科技资料数字化后都可以实现极为便捷的全文检索,通过关键词检索、组合检索等功能可迅速获得最准确的查询结果,这种便捷在以往的多方纸介质信息交流中是无法想象的。
尽管数字化科技资料有诸多好处,但其在我国的发展仍有一些困扰,其中最大的问题便是OCR识别率不高而导致的工作效率的低下.OCR(Optical Character Recognition)是通过扫描仪利用OCR软件,将点阵图形的的字符转变成文本的技术,也是在纸介质科技资料数字化过程中最关键的一步,即通过使用OCR进行纸介质信息扫描识别。目前大多数扫描仪都配备有OCR,但由于某些OCR产品识别率不高以及识别语种太少等问题,在进行识别之后会出现很多乱码,还要重新进行校对.另外科技资料中的图片、表格等数据信息较多,有些会在此种转换中或者消失,或者面目全非.所有这些都使得纸介质科技资料在数字化时极为尴尬,也正是由于这种状况,一些科研机构等在介入纸介质科技资料数字化时疑虑重重。
中海油基地集团下属中海实业信息技术开发分公司一直负责中海油内部科技资料的管理,在进行数字化的过程中也面临同样问题,之前保存的数量庞大的科技资料让数字化进程迟迟未能启动。
出于对海洋石油科技资料的保护和利用,中海实业一直在寻找纸介质资料数字化的高效工具,以便满足企业内部日益增长的科技资料数字化管理的需求。通过对国内外众多数字化工具的比对验证,中海实业于2004年选择了国内OCR行业的领军产品――文通TH-OCR2003数据录入工厂,在2005年又购买了最新版本的文通TH-OCR2005。中海实业在和文通公司的合作过程中,深刻地体验到了文通产品带来的快捷便利,文通公司也通过中海实业的数字化实践,不断完善自己的产品。北京文通信息技术有限公司作为自主创新研发OCR的企业,目前其OCR识别率达到国内最高的99.8%,识别速度为6000字每分钟,独有的亚洲文字(中文简体、中文繁体、日文、韩文)识别技术更是得到了业界的高度认可,并已在微软Office 2003中全面配装。质量较好的纸介质文件,如几十页的杂志等,在短短几分钟内就转成了一个版式工整、页面整洁的双层PDF文档。
相关文章- 文章排行
- 周排行
- 月排行
- 年排行

我要评论




