用于语音辅助医疗诊断的装置与方法

文档序号：6384775阅读：378来源：国知局

专利名称：用于语音辅助医疗诊断的装置与方法
技术领域：
本发明有关于提供医疗诊断的装置及方法，且特别有关于提供语音辅助的医疗诊断的装置及方法。
背景技术：
目前民众主要通过去医疗院所看诊以接受医疗诊断和获取健康信息。但对于罹患慢性疾病的病患而言，追踪其长期健康状况是很重要的。因此，慢性疾病的病患必须定期去医疗院所看诊，花费很多时间与金钱。另一方面，许多医疗诊断技术利用各种信号诊断疾病，例如血压、心电图或脑波等。尽管如此，个人的语音信号也可以用来协助一些疾病的诊断，尤其是慢性疾病。举例而言，字汇能力的衰退可能是一些疾病的早期警讯，例如失智症(dementia)和帕金森氏症(Parkinson’s disease)。但是,单凭人类感知可能很难判别字汇能力的改变和不同疾病之间或疾病不同阶段之间的字汇能力差异。例如，在帕金森氏症的早期阶段，病患通常不会发现到自己字汇能力的衰退。因此，病患有可能无法察觉疾病的早期征兆，而错失早期诊断与治疗的机会。

发明内容
有鉴于此，本发明提供一种装置，通过匹配个人的语音信号与语音模型，诊断特定疾病和/或追踪并分析个人的健康状况。本发明一实施例提供一种用于语音辅助医疗诊断的装置，包括:一数据库，储存与个人相关的一语音模型；一输入单元，从该个人接收一语音信号；一语音匹配单元，进行该语音信号与该语音模型的匹配；以及一诊断单元，根据该语音匹配单元的匹配结果，诊断该个人是否罹患多个预定疾病其中的一或多个。上述装置还包括:一语音训练模块，从该个人的语音产生该语音模型。上述装置还包括:一语音辨识单元，分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；其中该诊断单元根据该语音匹配单元的该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。上述装置还包括:一警示单元，当语音匹配单元的该匹配结果达到或超过一预定阈值时，提出一警告至该个人。本发明另一实施例提供一种用于语音辅助医疗诊断的装置，包括:一数据库，储存与多个预定疾病相关的多个语音模型；一输入单元，从个人接收一语音信号；一语音匹配单元，进行该语音信号与所述多个语音模型的匹配；以及一诊断单元，根据该语音匹配单元的匹配结果，诊断该个人是否罹患所述多个预定疾病其中的一或多个。上述装置还包括:一语音辨识单元，分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；其中该诊断单元根据该语音匹配单元的该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。本发明另一实施例提供一种语音辅助医疗诊断的方法，包括:从个人接收一语音信号；进行该语音信号与一语音模型的匹配，并产生一匹配结果；以及根据该匹配结果，诊断该个人是否罹患多个预定疾病其中的一或多个。上述方法还包括:从该个人的语音产生该语音模型。上述方法还包括:分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；以及根据该语音匹配单元的该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。上述方法还包括:当语音匹配单元的该匹配结果达到或超过一预定阈值时，提出一警告至该个人。本发明再一实施例提供一种语音辅助医疗诊断的方法，包括:从个人接收一语音信号；进行该语音信号与多个语音模型的匹配，并产生一匹配结果，其中所述多个语音模型与多个预定疾病相关；以及根据该匹配结果，诊断该个人是否罹患所述多个预定疾病其中的一或多个。上述方法还包括:分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；以及根据该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。

图1所示为根据本发明一实施例的用于语音辅助医疗诊断的装置的示意图；图2所示为根据本发明另一实施例的用于语音辅助医疗诊断的装置的示意图。其中，附图标记说明如下:110、210 数据库；111、211 语音模型；

120,220 输入单元；130,230 语音匹配单元；140 警示单元；150、250 语音辨识单元；151、251 特征提取模块；152 语音测试模块；160、240 诊断单元。
具体实施例方式以下说明为本发明的实施例。其目的是要举例说明本发明一般性的原则，不应视为本发明的限制，本发明的范围当以申请专利范围所界定者为准。如上列先前技术所述，个人的语音信号可被用来协助一些疾病的诊断。为了建立用于语音辅助医疗诊断的装置，本发明的基本概念为建立语音模型。在一实施例中，一语音模型包括一些声音和/或语音特性，例如音高、音调、节奏、发音、音量、声波、清晰度、间隔、流畅度、音节、重音、母音、子音等。这些声音和/或语音特性可通过语言学参数决定，例如音系学(phonology)或/和语言学(phonetics)。举例而言,语音信号的流畅度可通过间隔是否正确配置和/或间隔的数目决定。另外，流畅度也可根据通话时间比、发音、沉默暂停的计数、暂停的总时间和暂停的平均长度。在本发明一实施例中，建立分别与不同疾病相关的多个语音模型。举例而言，在本实施例中，建立与失智症相关的一语音模型以及与帕金森氏症相关的一语音模型。须注意的是，一疾病可与不只一个语音模型相关。在本实施例中，通过进行个人的语音信号与所述多个语音模型的间的匹配，可决定语音信号是否与所述多个语音模型其中一或多个语音模型相似。若语音信号与所述多个语音模型其中的一语音模型高度匹配，则诊断该个人罹患与上述高度匹配的语音模型相关的疾病。举例而言，对于罹患失智症的病患而言，正确地重复一些母音型式是很困难的,例如“bee-bah-boh”。当要求罹患失智症的病患重复说“bee-bah-boh”四次时，他/她可能会说出“bee-boh-boh”或“bee-bee-bee”。因此，当个人被要求重复说“bee-bah-boh”四次时，该个人的声音信号被录制下来并且和一些与失智症于“bee-bah-boh”的字汇表现有关的语音模型进行匹配，以判断该个人是否罹患失智症。除此之外，当进行语音信号与语音模型之间的匹配时，重复四次的“bee-bah-boh”之间的间隔长度也可列入考量。另外，与疾病相关的语音模型也可根据不同的测试脚本建立。举例而言，“bee-key-gee”也是失智症的测试脚本,可取代“bee-bah-boh”。上述多个语音模型可对应不同性别、不同年龄或/和不同语言建立于不同的集合当中。因此，个人的语音信号系与对应于该个人的性别、年龄或/和语言的语言模型集合进行匹配。在另一实施例中，通过匹配语音信号与语音模型，不只可以诊断个人是否罹患某疾病，也可以判断该个人处于此疾病的哪个阶段。例如，一疾病的语音模型组合包括多个语音模型，其中每个语音模型与该疾病的一阶段相关。在另一实施例中，通过匹配个人目前的语音信号以及该个人在一段时间以前的语音模型，以追踪该个人的健康状况变化。举例而言，若目前的语音信号与一个月以前的语音模型的间的差异大于一预定阈值，则判定该个人的健康状况变化为剧烈，并判定该个人的健康状况可能恶化。图1所示为根据本发明一实施例的用于语音辅助医疗诊断的装置10的示意图。如图1所示，装置10包括数据库110、输入单元120、语音匹配单元130、警示单元140、语音辨识单元150以及诊断单元160。与个人相关的语音模型111储存于数据库110中。语音模型111可为在一段时间以前从该个人取得的语音模型。输入单元120接收该个人的语音信号。语音匹配单元130进行上述语音信号与语音模型111的匹配。诊断单元160根据语音匹配单元130的匹配结果，诊断该个人是否罹患多个预定疾病其中的一或多个。当语音匹配单元130的匹配结果达到或超过一预定阈值时，警示单元140对该个人提出警告。举例而言，若上述语音信号与语音模型111的间的差异很大，则该个人的健康状况可能恶化。在一实施例中，当该个人大声念出一或多个预定脚本时，将其语音录制为上述语音信号。上述一或多个预定脚本系通过输出单元(未图示)提供，例如一显示荧幕或一声音播放器。
语音辨识单元150分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况。上述多个预定问题可通过上述输出单元给该个人。举例而言，上述多个预定问题可显示在一显示荧幕上。输入单元120接收该个人的语音回答，例如针对所述多个预定问题的答案。然后语音辨识单元150利用语音辨识提取该个人的语音回答的关键字，并利用这些关键字，根据这些关键字与医疗状况之间的统计分析，判断该个人的一或多个医疗状况。在另一实施例中，可利用一手写板或一键盘接收该个人的答案，而一处理单元可利用文字辨识从上述答案中提取关键字，以根据这些关键字判断该个人的一或多个医疗状况。当判断该个人的一或多个医疗状况时，也可考虑一些参数，例如打字力道或针对所述多个预定问题的反应时间。诊断单元160利用统计分析方法，根据语音匹配单元130的匹配结果以及语音辨识单元150所判断的该个人的上述一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。因此，装置10同时根据该个人的语音变化以及该个人的医疗状况诊断该个人是否罹患所述多个预定疾病其中的一或多个。在另一例子中，装置10可更进一步包括一语音训练模块(未图示)。语音训练模块从该个人接收语音并产生上述语音模型111。在另一例子中，装置10可更进一步包括一语音处理单元(未图示)。语音处理单元提取该语音信号的声音和/或语音特性，并将这些特性提供至语音匹配单元130。然后语音匹配单元130利用这些特性进行该语音信号与语音模型111的间的匹配。例如，语音匹配单元130可根据该语音信号与语音模型111的间的特性匹配程度决定一分数，此分数代表该语音信号与语音模型111的间差异。当此分数大于一预定阈值时，警示单元140提出警告至该个人。图2所示为根据本发明另一实施例的用于语音辅助医疗诊断的装置20的示意图。如第2图所示，装置20包括数据库210、输入单元220、语音匹配单元230、诊断单元240以及语音辨识单元250。输入单元220从个人接收一语音信号。与多个预定疾病相关的多个语音模型211储存于数据库210中。上述多个语音模型211可根据表现与一预定疾病有关的至少一个显著特征的多个预定脚本建立。语音匹配单元230进行上述语音信号与上述多个语音模型211的间的匹配。诊断单元240根据语音匹配单元230的匹配结果，诊断该个人是否罹患上述多个预定疾病其中的一或多个。在一例子中，至少一个预定脚本系通过输出单元(未图示)提供，例如一显示荧幕或一声音播放器。当该个人大声念出输出单元所提供的上述至少一个预定脚本时，输入单元220将该个人的语音录制为上述语音信号。在另一例子中，诊断单元240利用统计分析方法，不只根据语音匹配单元230的匹配结果，还根据语音辨识单元250所判断的该个人的一或多个医疗状况，诊断该个人是否罹患上述多个预定疾病其中的一或多个。类语音辨识单元250似于上述第I图的语音辨识单元150，语音辨识单元250分析该个人针对多个预定问题的语音回答以判断该个人的上述一或多个医疗状况。装置20可更进一步包括一语音训练模块(未图示)。语音训练模块从该个人接收语音并上述语音模型。装置20可更进一步包括一语音处理单元(未图示)。语音处理单元提取该语音信号的声音和/或语音特性，并将这些特性提供至语音匹配单元230。然后语音匹配单元230利用这些特性进行该语音信号和与上述预定脚本相关的上述多个语音模型211的间的匹配。若该语音信号与上述多个语音模型211其中一个或多个匹配，则诊断单元240诊断出该个人罹患与匹配的语音模型相关的一或多个预定疾病。在另一例子中，数据库110和数据库210也可储存该个人的病例档。诊断单元160和诊断单元240可参考病例档以协助诊断该个人的状况。如上所述，本发明提供一种用于语音辅助医疗诊断的装置以诊断一些具有声音或/和语音特性变化的疾病，例如失智症等。本发明的上述装置也可追踪病患的状况并在状况恶化时提出警告给该病患。在另一实施例中，数据库110和210、语音匹配单元130和230、诊断单元160和240以及语音辨识单元150和250可全部配置于一服务器电脑当中，该服务器电脑配置有电脑可执行指示，通过执行这些电脑可执行指示，可实现上述单元的功能。输入单元120和220可为可接收语音信号的通讯装置。该服务器电脑连接至一通讯网络，该通讯装置也连接至该通讯网络，并透过该通讯网络与该服务器电脑进行数据通讯。举例而言，上述多个预定脚本以及上述多个预定问题显示于一移动电话的显示荧幕上，该个人的该语音信号系透过该移动电话的接收器接收，该语音信号透过该通讯网络传送至远端服务器电脑以诊断该个人是否罹患多个疾病其中的一或多个，或者/并且追踪该个人的状况。若远端服务器电脑的语音匹配单元的匹配结果达到或超过一预定阈值时，远端服务器电脑传送一警告信号至该移动电话，因此该移动电话的荧幕根据该警告信号显示一警告讯息，或者该移动电话的扩音器根据该警告信号播放该警告讯息，以告知该个人其罹患疾病。并且，远端服务器电脑也可透过该通讯网络传送诊断和医疗建议至该移动电话。本发明的方法，或特定型态或其部份，可以以程序码的型态存在。程序码可以包含于实体媒体，如软盘、光盘、硬盘、或是任何其他电子设备或机器可读取(如电脑可读取)储存媒体，也或不限于外在形式的电脑程序产品，其中，当程序码被机器，如电脑载入且执行时，此机器变成用以参与本发明的装置或系统，且可执行本发明的方法步骤。程序码也可以透过一些传送媒体，如电线或电缆、光纤、或是任何传输型态进行传送，其中，当程序码被电子设备或机器，如电脑接收、载入且执行时，此机器变成用以参与本发明的系统或装置。当在一般用途处理单元实作时，程序码结合处理单元提供一操作类似于应用特定逻辑电路的独特装置。以上所述为实施例的概述特征。所属技术领域中具有通常知识者应可以轻而易举地利用本发明为基础设计或调整以实行相同的目的和/或达成此处介绍的实施例的相同优点。所属技术领域中具有通常知识者也应了解相同的配置不应背离本创作的精神与范围，在不背离本创作的精神与范围下他们可做出各种改变、取代和交替。说明性的方法仅表示示范性的步骤，但这些步骤并不一定要以所表示的顺序执行。可另外加入、取代、改变顺序和/或消除步骤以视情况而作调整，并与所揭露的实施例精神和范围一致。
权利要求
1.一种用于语音辅助医疗诊断的装置，包括一数据库，储存与个人相关的一语音模型；一输入单元，从该个人接收一语音信号；一语音匹配单元，进行该语音信号与该语音模型的匹配；以及一诊断单元，根据该语音匹配单元的匹配结果，诊断该个人是否罹患多个预定疾病其中的一或多个。
2.如权利要求I所述的用于语音辅助医疗诊断的装置，还包括一语音训练模块，从该个人的语音产生该语音模型。
3.如权利要求I所述的用于语音辅助医疗诊断的装置，还包括一语音辨识单元，分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；其中该诊断单元根据该语音匹配单元的该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。
4.如权利要求I所述的用于语音辅助医疗诊断的装置，还包括一警示单元，当语音匹配单元的该匹配结果达到或超过一预定阈值时，提出一警告至该个人。
5.一种用于语音辅助医疗诊断的装置，包括一数据库，储存与多个预定疾病相关的多个语音模型；一输入单元，从个人接收一语音信号；一语音匹配单元，进行该语音信号与所述多个语音模型的匹配；以及一诊断单元，根据该语音匹配单元的匹配结果，诊断该个人是否罹患所述多个预定疾病其中的一或多个。
6.如权利要求5所述的用于语音辅助医疗诊断的装置，还包括一语音辨识单元，分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；其中该诊断单元根据该语音匹配单元的该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。
7.一种语音辅助医疗诊断的方法，包括从个人接收一语音信号；进行该语音信号与一语音模型的匹配，并产生一匹配结果；以及根据该匹配结果，诊断该个人是否罹患多个预定疾病其中的一或多个。
8.如权利要求7所述的语音辅助医疗诊断的方法，还包括从该个人的语音产生该语音模型。
9.如权利要求7所述的语音辅助医疗诊断的方法，还包括分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；以及根据该语音匹配单元的该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。
10.如权利要求7所述的语音辅助医疗诊断的方法，还包括当语音匹配单元的该匹配结果达到或超过一预定阈值时，提出一警告至该个人。
11.一种语音辅助医疗诊断的方法，包括从个人接收一语音信号；进行该语音信号与多个语音模型的匹配，并产生一匹配结果，其中所述多个语音模型与多个预定疾病相关；以及根据该匹配结果，诊断该个人是否罹患所述多个预定疾病其中的一或多个。
12.如权利要求11所述的语音辅助医疗诊断的方法，还包括分析该个人针对多个预定问题的语音回答以判断该个人的一或多个医疗状况；以及根据该匹配结果以及该个人的该一或多个医疗状况，诊断该个人是否罹患所述多个预定疾病其中的一或多个。
全文摘要
本发明公开了一种用于语音辅助医疗诊断的装置与方法，包括一数据库，储存与个人相关的一语音模型；一输入单元，从该个人接收一语音信号；一语音匹配单元，进行该语音信号与该语音模型的匹配；以及一诊断单元，根据该语音匹配单元的匹配结果，诊断该个人是否罹患多个预定疾病其中的一或多个。
文档编号G06F19/00GK103251386SQ20121055683
公开日2013年8月21日申请日期2012年12月20日优先权日2011年12月20日
发明者沈家麟, 梁荣昌申请人:台达电子工业股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：沈家麟;梁荣昌
技术所有人：台达电子工业股份有限公司
我是此专利的发明人

上一篇：一种地理信息系统gis的地图显示方法及装置的制作方法
上一篇：数据处理系统以及数据处理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。