. 石磊准备的第二操作系统,是基于gmm/高斯混合模型的计算方式,主要用于开发语音系统。
所谓的高式混合模型,是一种用高斯概率密度函数精确的量化事务,将一个事务分解成若干个高斯概率密度函数,也就是正态分布曲线,而形成的一种模型。
gmm模型通常用作语音识别,在计算机领域中,获得了广泛的应用。虽然gmm模型制作的语音识别,会有大约20-30的错误识别率,但只要语音足够标准,而且配合行为动态识别引擎监控唇语,这个错误识别率会大大的降低。
唇语方面的嘴唇行为动态,通过行为动态识别引擎,完全可以捕捉成功的识别。至于语音命令足够标准,那就不是石磊可以控制的了,毕竟各地方言不同,只能基于普通话为标准。
石磊可以肯定的给予回应,想要玩好《勇者世界》,那么一定要有一口标准的普通话。也许随着《勇者世界》的风靡,在夏国境内,还会掀起一股学习普通话的热潮呢!
如果真是这样,《勇者世界》有可能会得到夏国官方的推荐,若真的可以得到官方推荐,那《勇者世界》绝对会飞黄腾达!
gmm高斯混合模型并不复杂,在自然语言处理中,这只是浅层学习神经网络。在零六年的时候,加拿大多伦多大学的教授,在顶级科学刊物《科学》上,发布了一篇名为学术论文,其中介绍了深层学习神经网络的问题。很多隐层的人工神经网络具备优秀的特征学习能力,学习得到的特征对数据有更本质的刻画。这就是与浅层学习神经网络对应的深层学习神经网络。
石磊重生之前,2012年的时候,由斯坦福大学和一名大规模计算机系统专家,共同使用16000个core.cpu,建造的名为deep.neural.networks/深层神经网络模型,曾经做出过从英文同声翻译至夏国语,这个翻译过程十分流畅,根本没有半分卡顿,错误率方面连百分之一都不到!
天使议会的那个伪人工智能,便是使用dnn深层神经网络模型构建的!
可惜石磊暂时没有时间,开发基于dnn的深层神经网络模型,只能做基于gmm的浅层神经网络,制作语音识别系统,然后利用行为动态识别引擎,识别唇语的方案,减少识别错误率。
关于语音系统,开发出来之后,不仅仅可以引用在《勇者世界》中,还可以应用在很多方面。
特别是结合行为动态识别引擎之后,那就是一个十分强悍的系统。拥有语音识别系统后,石磊便可以语音控制计算机。
到时候,石磊甚至可以一个人模拟两个人的进攻,也可以自己和自己战斗,为他自己的身份做更好的掩饰。
还有一些监控系统,也可以做到更好的程度。比如医疗监控系统,某些不能动弹的患者却可以说话,那么这样的患者,就可以通过语音进行操作医疗系统,呼唤护士或者医生等等服务。
关于基于gmm的语音系统,在石磊心中,还有一个想法,那就是
回归开发《勇者世界》的主题,在拥有行为动态识别引擎,以及gmm语音系统辅助配合,才可以形成真正的体感游戏。
至于另一个难点,人物动作系统的问题,石磊打算开发第三辅助操作系统。也就是利用行为动态识别引擎,专门追踪玩家的瞳孔,然后利用软件计算,确定玩家的视线焦点。
关于瞳孔追踪技术,目前这个年代还没有被申请专利,石磊正好可以将这项技术霸占过来。这项技术原本的专利人是诺基亚,只可惜后世诺基亚衰落,全面被安卓秒杀。
瞳孔追踪技术,应用在《勇者世界》中,好处有很多。结合行为动态识别引擎、gmm语音系统,便可以完美的实现一些高难度的体感操作动作。
比如说轻功,在现实中,玩家绝对不可能实现的体感操作。举一个例子说明,如果玩家在一处悬崖峭壁上,想要使用轻功飞身下去。
这个时候,使用体感操作,总不可能找一个地方跳下去吧?于是,瞳孔追踪技术就可以应用上来,使用瞳孔追踪技术,然后小幅度的跳跃动作,就可以从悬崖上跳下去。
至于悬崖的各处落脚
hk349 gmm/高斯混合模型和瞳孔追踪