专栏名称: 百度智能云
聚焦人工智能(AI)、大数据(Big Data)、云计算(Cloud),以“ABC”三位一体战略,帮助企业客户实现数字化、智能化转型。百度云,智能,计算无限可能!
目录
相关文章推荐
百度智能云  ·  第一!百度智能云领跑中国金融大模型市场 ·  23 小时前  
滴滴招聘  ·  第九届滴滴未来精英夏令营火热报名中! ·  2 天前  
白鲸出海  ·  美国下边这五国,已经离不开中国了 ·  2 天前  
51好读  ›  专栏  ›  百度智能云

云智一体让视频更优质!

百度智能云  · 公众号  · 科技公司  · 2021-05-24 19:29

正文

请到「今天看啥」查看全文


  • 画面去噪: 基于无监督去噪声算法,摆脱了有监督神经网络训练对于成对的噪声与干净图像的依赖;设计了可交互控制参数,支持用户调节,增加了系统灵活性。

  • 画质增强: 通过深度残差神经网络,将内容特征提取与重建,不仅可以优化画质饱和度、还原压缩视频导致的失真,还能对 ROI 区域进行区域增强和码率分配优化。

  • 高帧率重制: 依靠 MEMC 高帧率提升技术能力,通过对运动方向预判,据此进行插帧,提升画面流畅度与观屏舒适度。

  • 超高清编码: 采用 CPU+GPU+ASIC 的异构加速计算框架,支持国产昆仑 K200 AI 加速卡,提升 AI 推理效率和超高清编码效率,降低用户成本,提升总体的生成效率。

  • 智感超清
    实时音视频通讯: 依靠核心自研的多个算法,实现通讯顺畅的超低延时互动体验,并分为如下几个方面:

    • 抗弱网支持方面: 基于上/下行链路智能探测器,根据上下行网络链路恶化程度因子,调整 FEC、NACK、码控、超清权重,选择因子进行抗弱网抖动算法,使视频抗弱网可达到60%,音频80%。

    • AI 能力方面: 通过百度多年的 AI 技术积累,支持实时美颜、滤镜、贴纸、AR 特效,更多娱乐场景玩法,并提供人脸识别、语音识别等能力,适用于用于身份核验、学生状态监测等更多场景。

    • 高质量音视频通话方面: 通过大量音视频场景数据 AI 模型训练,对音频进行 3A 优化的同时,并能通过智感超清支撑超高清画质,自动适配多分辨率,实现高质量音视频消息聊天。

    • 性能指标方面: 为针对通信节点路由的选择,优化混沌神经网络算法规划最短路径、实现动态平衡路由选择,可使端到端延时稳定收敛到 200ms 左右,并在单个节点故障时,能自动重建路由,保障 server 的可用性。依靠 WHIP 协议转换装置解决了传统 RTC 通信 server 由于信令交互复杂、房间管理业务量大、数据库操作频繁等影响性能及大规模搞并发问题,可支撑每个房间在线人数达百万级别。

    • 端到端性能监控方面: 通过各端大量数据收集,依托百度智能云大数据分析,能精准的定位问题,对潜在的不可靠服务提前预警,让潜在风险在萌芽状态被解决,保障音视频实时通信服务的高可用。

    实时音视频通讯

    低延时直播: 采用了全链路 SRT 协议,可稳定支撑千万级直播并发。关键特性包括:

    • 卓越抗弱网: 自研 mpegts 数据格式封装、支持 SRT 协议推拉流,将网络丢包的可能性降到最低,有效改善弱网环境下的推流及观看体验。

    • 首屏秒开: CDN 边缘先将编码参数信息发给播放器,播放器解析到编码信息,待下个关键帧到达后即可快速播放。

    • 协议兼容: 实现多种视频流协议的输入与输出, 基于 SRT 低延迟直播协议的上下行,能无缝接入 LSS 低延迟直播系统,与主流直播分发协议 HTTP-FLV/RTMP/HLS 结合,视频转发场景更加灵活。

    • 规模并发: 与 HTTP-FLV 支持的并发规模一致,支持千万级规模并发。


    低延时直播
    视频分发基础设施CDN: 拥有遍布全球1000+节点、100T 带宽储备,以强大网络基础设施带来极致视频分发体验和效率。其中具有这几大能力:

    • 资源储备的扩展能力: 通过云边端一体,将资源的使用能力持续下沉,与边缘计算的资源深度结合,做到流量加速的同时,也能做到算力的加速。

    • 近似实时的智能调度能力: 具备全网流量与质量的感知系统,能实现近似实时的智能调度。

    • 分场景的协议调优能力: 通过质量感知系统 Bcats、节点多级缓存优化、分场景协议栈优化满足客户多场景的质量要求,节点间使用私有协议加速,提升加速体验并保证数据安全。

    • 快速便捷的可编程能力: 通过易用的可编程边缘运行环境 EJS,用户可自主实现个性化业务控制逻辑,应对业务变化的敏捷效率挑战。







    请到「今天看啥」查看全文