南宫28一款好用的当地语音识别输入器材
时间:2024-05-06浏览次数:
 这几年AI的繁荣格外的疾速,也闪现出了不少好用的器械。我之前跟公共分享过,好比说人声阔别呀,语音和文字的互转呀,这些器械都很适用。迩来有不少厂家都正在组织AI干系方面的利用,而正在开源界,实在也有良众很不错的项目或者大神。即日跟公共分享的便是一款格外好用的语音识别输入器械,十足当地运转,无需联网。  这个项目正在github的所在是,作家HaujetZhao,项目名CapsWriter-Off

  这几年AI的繁荣格外的疾速,也闪现出了不少好用的器械。我之前跟公共分享过,好比说人声阔别呀,语音和文字的互转呀,这些器械都很适用。迩来有不少厂家都正在组织AI干系方面的利用,而正在开源界,实在也有良众很不错的项目或者大神。即日跟公共分享的便是一款格外好用的语音识别输入器械,十足当地运转,无需联网。

  这个项目正在github的所在是,作家HaujetZhao,项目名CapsWriter-Offline(之后同一用CapsWriter称之),因为极少家喻户晓,却又未便当说的原故,这里恐怕给不了公共直接的所在,这种东西确实需求一点点的门槛。项目开源,利用的是阿里巴巴开源的 Paraformer 模子和标点符号模子。作家依然把Windows的可奉行文献和模子都做好打包了,外面上只需求下载解压运转就能够。小我感触有点搞乐的是中文语音输入的模子唯有230MB巨细,而标点符号模子却有1GB巨细,但如何样也算格外小了。

  这个项方针运转十足依赖于当地模子,然而杠精信任会说,你这不是有供职端跟客户端吗?是的,干系的本事题目我也懒得科普,实在大局限器械都是这么个形式,只是把供职端跟客户端一道打包隐秘起来了罢了。这个项目所利用的供职端,由于本事原故只维持win10,作家又很知心的给客户端供给了32位win7的版本,罢了。倘使你是win10本机运转,固然需求供职端跟客户端,然而我实测十足便是127.0.0.1的本机访候罢了,不需求互联网。

  解压完之后,目次下的config.py是首要的修设文献,利用记事本即可掀开编辑,这里我也把几个对比主要的选项用红框标注了出来。起初是识别形式,维持长按和按键切换开合两种形式,我小我依旧习性利用长按。而默认的急切键是巨细写键,这也恰是此项目叫做CapsWriter的原故,我这里是把它改成了键盘上的Scroll Lock键,知晓这个键的都跟我相似,是老家伙了吧。然后软件还维持把输入举行一个灌音,倘使没有需求的话,你能够紧闭这个效用,免得占用硬盘空间。标点符号、阿拉伯数字的转换、中英文之间是否有空格等,这些按照己方的实质利用习性来调治,其他的默认就能够。

  CapsWriter对比好用的是维持中文热词效用,识别率还挺高的。十足依赖当地离线模子的器械是有这个题目,便是你不太好去扩充词库,除非从新熬炼模子。而热词效用就能够基础处置这个题目。

  同时它再有英文热词的效用,但小我觉得识别确切度跟中文依旧有一点差异。也不知晓是我的英文反对,依旧模子原先就着重于中文。

  再有极少不属于识别毛病,然而是常用词或者专驰名词更换的,也能够正在hot-rule.txt里举行修树。但不管如何样,目前信任是达不到百分百的准确率的,依旧需求己方举行极少后期的校阅。

  正在供职端跟客户端窗口,也都能够看到每一句的识别结果。这篇著作也有一局限,我是利用语音识别来举行输入的。当然,每一句每一个词我都有举行校阅,并且它也并不是AI天生著作,只是换成了语音输入罢了。以目前的利用体验来看,我感触比不少的联网或者收费器械都要来的好用,更别说手机上了。手机不管是各家的输入法,依旧什么王者光彩的语音识别南宫28,准确率基础都是零,每一句话都有好几个的毛病,真的是不胜大用。

  这个项方针修设央浼也格外低,仅对供职端央浼64位WIN10,占用4G支配的体系内存。客户端能够利用32位的win7,局域网当地IP维系。其余,它再有什么枢纽字、日记、视频文献转录等效用,但我感触这并不是它的中枢需乞降强项。

  谢谢公共的观望点赞和合怀,有什么疑义和需求,能够正在评论区里调换,咱们下期再睹。一款好用的当地语音识别输入器械

Copyright 2012-2023 南宫28(中国.NG)官方网站 版权所有 HTML地图 XML地图--备案号:鲁ICP备09041058号  备案号:鲁ICP备09041058号  
地址:山东省淄博市高新区柳泉路125号先进陶瓷产业创新园B座606室  邮箱:qht@3583100.com  电话:0533-3583100