主要观点总结
本文介绍了好未来与微软合作推出的智能学习助手“九章随时问”。该小程序通过AI技术,为学生提供个性化的数学学习辅导,强调思维能力的培养,并采用了语音交互方式,使学生可以通过语音提问并得到详细的解答。文章还提到了开发过程中的技术难点,如数学领域的自动语音识别和文本到语音技术。此外,好未来在AI+教育的创新探索中,利用九章大模型与微软Azure AI服务合作,提高了教育服务的质量和效率。同时,好未来也注重安全教育问题,与微软等合作伙伴共同构建智慧学习生态系统,致力于支持并践行终身学习的理念。
关键观点总结
关键观点1: “九章随时问”小程序通过AI技术为学生提供个性化的数学学习辅导。
学生可以通过拍照上传题目,得到快速的讲解。它不仅提供答案,还引导学生理解解题过程,探索其他解法,强调思维能力的培养。
关键观点2: “九章随时问”采用语音交互方式。
小程序设计了两种独特的讲解模式,并特别支持语音播报功能,让学生可以通过语音提问并得到详细的解答。
关键观点3: 开发过程中的技术难点包括数学领域的自动语音识别和文本到语音技术。
好未来采用了微软Azure的高精准ASR和超拟人TTS技术,实现了更准确的识别和更自然的语音输出。
关键观点4: 好未来在AI+教育的创新探索中利用九章大模型与微软Azure AI服务合作。
这提高了教育服务的质量和效率,也体现了好未来对未知世界的探索精神和对教育的执着追求。
关键观点5: 好未来注重安全教育问题,与微软等合作伙伴共同构建智慧学习生态系统。
这不仅是技术与教育的融合,更是一种共同致力于塑造未来教育的责任感和使命感。
正文
然而,开发“九章随时问”小程序并非易事。当前的大型语言模型,是基于大规模文本数据进行训练而生成的,而缺乏真正的推理能力。好未来将其应用于数学领域,无疑是一项大胆的挑战。这意味着面临的难题更多,克服的障碍也更为复杂。
数学领域的自动语音识别(ASR)尤为困难。例如,当提到“复数”时,系统需要分辨出这里是指“复合的复”还是“正负的负”。这种歧义,加上数学公式本身就复杂,以及用户在说话时的吞音和口音等因素,使得精准识别变得更加困难。此外,数学表达式中常常混杂中英文,进一步增加了识别的难度。
市面上已有的ASR实时转写技术,常常难以应对这些细节,导致识别准确性不高。而“九章随时问”,需要突破这些障碍,做到真正“听懂”用户的需求。
仅仅能“听懂”是不够的,“九章随时问”还需要与用户进行自然的语音交流,这也就涉及到了文本到语音技术,即TTS,使机器能够“开口说话”。早期的TTS技术,输出的声音通常显得机械、生硬,缺乏情感和自然语调。然而,在与用户交互时,拟人化的语音输出至关重要。自然的停顿、情感的传递、语调的抑扬顿挫,这些细节决定了用户体验的成败。
好未来曾自研TTS技术,虽然可以完成简单的文本朗读,但在用户交互中,依然显得生硬和机械。用户更喜欢自然流畅的语音输出,这要求TTS技术能够模拟出近似人类的语音特征。
为了实现这一步目标,好未来对比了多家业界厂商的产品,最终采用了微软Azure提供的高精准ASR和超拟人TTS技术。
微软的自研ASR技术在复杂场景下,尤其是处理数学公式时,表现出色。微软Azure的TTS技术提供高度拟人化的语音输出,自然传达情感和语调。这些技术使得“九章随时问”不仅识别更加准确,输出也更加拟人化,极大提升了用户的学习体验。
“我们必须知道,我们必将知道”,这句著名数学家戴维·希尔伯特的话,表达了对人类探索未知世界、追求知识的坚定信念。这是九章大模型(MathGPT)的座右铭,写在其官网首页上。作为好未来九章大模型的智慧教育产品,“九章随时问”在这一信念下应运而生,这种对探索未知的执着精神,也正是“九章随时问”所秉持的理念,它相信每个学生都具备解决问题的潜力。
“九章随时问”是好未来在AI+教育布局中的一个重要创新,折射出其深远的AI战略。好未来成立于2003年,多年来致力于提供优质的教育服务。近年,好未来积极拥抱AI,探索教育变革的无限可能。
在2023年初,好未来集团率先为上千名研发人员配备了GitHub Copilot 智能副驾驶
®
,成为中国首批使用这一工具的公司之一。这一举措不仅提高了代码的质量和效率,还为公司节省了大量的开发成本。
代码的平均采纳率达到33%,每月采纳代码总数约为25万行,单月Chat交互次数近2万次。我们的工作效率得到显著提升,相当于额外拥有了两百多位工程师。
这种效率的提升,对于一个追求创新的企业而言,意义重大。