北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

公司新闻NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

捷通华声推出灵云多语种OCR识别

 发布于:2014-08-29 15:12   浏览:
        近日,捷通华声宣布灵云智能开放平台多语种OCR识别能力服务进入试运营阶段,开始提供包括中文、英文、德文、法文、俄文、西班牙文、意大利文等十几个国家语言文字的自动识别服务。此次灵云多语种OCR能力的发布,也是继灵云平台推出13种语言的灵云语音合成、93种语言的灵云手写识别技术能力之后,灵云平台服务多国语言方面所取得的最新进展。

 

        作为中国人工智能领域的领军企业,捷通华声自2000年开始坚持自主研究智能语音、图像等人工智能技术,并不断在OCR、手写识别等智能图像技术领域取得突破。近年来,灵云OCR在扫描识别领域异军突起,以接近100%的中英文识别率和优质的版面分析能力获得了产业内广大用户的认可,为企业大幅减少了人工文字录入工作量、提高了文档编辑和搜索的效率。伴随经济全球化的进展,人工智能技术在多语言环境中的应用需求越来越迫切。捷通华声顺应产业发展趋势,在加大多语言人工智能技术研究的基础上,依托灵云智能开放平台以开放、合作、共赢的战略发展思路,与国内外顶尖人工智能研究机构、企业开展广泛合作,全面为中国企业提供多语言人工智能技术能力服务。此次上线的多语种OCR,可以帮助企业与广大用户将德文、法文、俄文、西班牙文、意大利文等不同国家语言的文件、书籍、报纸、杂志等档案数字化,生成便于传输和管理的PDF文件,将有力促进国内企业参与国际交流。

        自灵云智能开放平台2011年推出灵云OCR以来,不仅面向广大用户提供直接文字识别服务,同时针对金融,能源,交通,政府,企业等领域企业户提供定制化服务。灵云OCR通过匹配图像中的关键信息来自动确认图像种类,获得更加准确的识别结果。目前灵云OCR已实现对身份证,驾驶证、行驶证、增值税发票,银行卡号、名片等各类证照、票据、表单的识别。针对特殊需求,灵云OCR还可以提供特殊定制功能,针对用户的图像种类进行模板定制,实现“一种核心,多类图像”的应用效果,尤其是在各大银行,证劵、保险公司,能源、电信、医疗、政府等办公营业厅的应用中,已成功实现人证统一、票据电子化、无纸化办公等功能,极大节省了大众用户办理业务的等待时间,也极大节省了企业业务成本,提高了办公效率,并通过减少大量复印以符合绿色环保办公的新趋势。

        灵云OCR支持扫描仪、手机、照相机、摄像机、高拍仪等各种图像扫描、拍照设备,并兼容市场的主流业务系统。在各种系统应用中,灵云OCR在确保原业务系统稳定性和安全性的同时,也可借助自学习功能不断丰富字符/图像特征库,从而提高自身在识别时对图像的适应能力。除了企事业办公以外,人们生活的方方面面也因灵云OCR技术的广泛应用而更加的生动有趣。目前,用户已经可以用手机、数码相机或DV拍照名片等纸质资料,并利用灵云OCR软件识别转换成可编辑的电子资料。可以想象,日后灵云OCR的应用场景将会越来越广泛,使用也将会越来越便捷。

        灵云平台此次推出多语种OCR也标示着灵云平台在实施面向国际、全面提供人工智能服务战略规划中,完成了第三步重要举措。作为全方位人工智能云服务开放平台,灵云平台囊括了语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、自然语言理解(NLU)以及机器翻译(MT)等多项人工智能能力,全方位赋予计算机思维和感官能力,使人与机器的沟通更加简单自然。2012年,灵云平台在手写识别领域迈出了国际化道路上第一步:推出覆盖全球92种语言的灵云手写识别技术,此举标志着我国手写识别技术已经达到行业领先水平!2013年,灵云平台继提供中文普通话、粤语、维吾尔语、英语服务之后,开始提供德语、法语、日语、韩语等13种语言的灵云语音合成技术,为需要多国语言服务的中国企业提供了丰富的智能语音能力支撑,迈出了灵云智能开放平台助力中国企业开拓国际市场、支持参与国际竞争的跨越之步。

        捷通华声在全面推动中国人工智能产业发展的进程中,灵云平台得到了清华大学的鼎力支持。捷通华声与清华大学人工智能重点实验室在图像识别、语音交互、语义理解等人工智能技术领域全面展开合作,在不断完善OCR多样化应用的同时,也在为研发更丰富的图像识别技术而努力,并将很快推出人脸识别等更多元化的图像识别技术,保证灵云平台拥有更加全面的“视觉与感观”能力。

        灵云智能开放平台(hcicloud.ocm)自2011年推出以来,已经为金融、电信、医疗、交通、能源、教育、医疗、政府等各个领域的用户提供人工智能技术服务,并以“云+端”的服务方式为百度导航、搜狗地图、京东商城、网易有道、滴滴打车、天行听书、天行输入法等数千款移动应用提供支持,为超过3亿社会大众提供服务。此次灵云多语种OCR的推出将进一步加强灵云与企业间的合作,为中国企业向国际化拓展提供更为有力的支持。未来发展,捷通华声灵云平台将在发挥灵云OCR等智能技术优势的基础上加强与清华大学深度合作,不断推出识别率更高、更宽广的智能图像识别技术与解决方案,为广大企业与用户提供人工智能技术服务,共同实现“灵云科技 源自清华 服务全球”的战略发展规划!

        体验与免费使用捷通灵云OCR能力,请访问灵云智能开放平台www.hcicloud.com