正文
➤ 应用示例:
https://ai.baidu.com/easydl/app/12/1200/models
▍在线语音合成臻品音库上线邀测,高度拟人、流畅自然
智能时代全面到来,如何让你的产品具备更流畅好听的声音?百度语音新增8个臻品音库,采用百度自主研发的并行 WaveRNN 合成技术,情感和韵律表现力大幅提升,合成语音情感饱满、高度拟人,为用户带来真人播报般的语音合成体验。支持 SDK、API 调用,手机 APP、智能硬件设备均可方便快捷地进行集成。
领先的技术优势:
自主研发的并行 WaveRNN 合成技术,业内率先实现基于 RNN 神经声码器的大规模工业部署,优质的声音体验已应用于百度 APP、掌阅、七猫小说等产品。
支持多语言多音色:
支持中文、中英文混读合成,提供磁性男声、甜美女声、可爱童声等风格多样的8种音库供您选择,让您的应用拥有个性化的声音。
方便快捷的集成方式:
提供 REST API 接口,任何可发起网络请求的设备均可方便地进行合成;提供 Android、iOS SDK,轻巧简便,便于手机 APP、智能硬件快速集成。
➤ 适用场景
百度大脑语音合成技术已经广泛应用于阅读听书、新闻播报、订单播报、语音导航等场景。
立即体验:
https://ai.baidu.com/tech/speech/tts_online
★ 文字识别
支持9类增值税发票的信息核验,包括专票、电子专票、普票等。对接国税平台查验,结果权威准确,支持返回票面的全部字段信息。
查看详情:
https://ai.baidu.com/tech/ocr/vat_invoice_verification
对各类办公文档的版面进行分析,输出图、表、标题、文本的位置和分版块内容的 OCR 识别结果,支持中、英两种语言,适配手写、印刷体混排场景。多规格“次数包”火热开售,单次调用低至0.06元。
https://ai.baidu.com/tech/ocr/doc_analysis_office
针对旋转车牌、监控高拍、夜间等复杂场景进行专项模型优化,进一步提升车牌号码与颜色的综合识别精度,充分适应不同拍摄条件、不同外界环境。
https://ai.baidu.com/tech/ocr_cars/plate
优化模型,提升合并单元格、单元格内多行文字等复杂表格的识别效果,结构化输出表头、表尾及每个单元格的文字内容。
https://ai.baidu.com/tech/ocr_others/table
结构化识别全国范围内不同版式的客运船票、货运船票,可识别发票代码、发票号码、发票日期、发票类型、总金额、出发地点、到达地点7个关键字段。
https://ai.baidu.com/tech/ocr/ferry_ticket
★ 图像技术、内容审核
针对拍照搜童书场景专项优化算法,可精准检索各类儿童绘本、教材图片。适用于学习机、学习平板等设备“拍照搜书”场景,在书本图库中自动检索出对应的封面或书页,实现绘本跟读、教材讲解等功能。多档规格“次数包”火热开售,价格低至4元/千次。
https://ai.baidu.com/tech/imagesearch/picturebook
识别出图片中多个主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、图片分类打标签等场景。多档规格“次数包”火热开售,价格低至1.3元/千次。
https://ai.baidu.com/tech/imagerecognition/object_detect
优化“警察部队、血腥、动物尸体、特殊服饰”等场景的识别效果,暴恐模型整体识别准召率提升5%以上,精准过滤各类暴恐违禁内容。
https://ai.baidu.com/tech/imagecensoring
▍
飞桨企业版 - 零门槛 AI 开发平台 EasyDL
新增商品陈列层数识别能力:定制商品检测服务 API 接口返回值中增加了 SKU 排位数和每层空位数的字段,可用于审核商品陈列顺序和货柜饱和度分析。
查看详情:
https://ai.baidu.com/easydl/app/1001/10010/models
▍
飞桨 PaddlePaddle 开源深度学习平台
★ 飞桨框架2.0正式版重磅发布,端到端的“基础设施”革新