基于P-trees kNN算法的毒物分类方法

时间:2022-10-23 01:32:52

基于P-trees kNN算法的毒物分类方法

摘 要:中毒是一种发生机率较大、对人体危害大的病症,而及时明确诊断,正确、规范的治疗既是抢救成功的关键,又是至今没有很好解决的难题。毒物层出不穷,基层急救医生的毒物知识和中毒抢救知识又明显不足,因此临床急需一种辅助系统以帮助各级急救医生提高中毒诊治水平及中毒抢救成功率。利用不同中毒表现对应不同毒物的权值向量构成“中毒表现加权向量表”,并将它作为训练数据集的属性值。构建中毒表现加权向量表的P树,并选择HOBBit距离作为距离度量标准,运用P-trees kNN分类算法进行毒物分类。将该方法应用到毒物分类系统中,运行效果良好。

关键词:k近邻算法;中毒分析系统;中毒表现加权向量表;P-树

中图分类号:TP18 文献标识码:A DoI: 10.3969/j.issn.1003-6970.2012.04.032

A Poison Classification Diagnosis Method Based on P-trees KNN

【Abstract】Poisoning is a kind of disease of greater probability takes place and endangers to the human body. Diagnose clearly in

time, correct, normal treatment is the key to rescuing successfully which is the difficult problem have not be solved. The poisonous substance emerges in an endless stream, the basic level doctor’s poisonous substance knowledge and poisoning rescue knowledge is obviously insufficient. So clinical need some accessory system badly to help doctors approving their poison diagnosis treatment and poison rescuing success rate. By statistic it can obtain poison’s weighted vectors corresponding difference clinical symptoms. thus can get weighted vector symptom table from these vectors and treats is as the attribute value of training dataset. with establishing the P-tree using these weighted vectors according the HoBBit distance measure, it can rapidly give possible poisoning diagnosis.

【Key words】K nearest neighbor; Poison classification method; Symptom weighted vector table; P-trees

急性中毒是急诊科常见急症,在全国多数综合医院急诊科中,中毒病例已占急诊科就诊者总数的6%~8%,占急诊抢救病例的6%~30%,农村和基层医疗单位所占比例更高[1]。利用计算机对中毒进行辅助诊治的应用系统已有出现[2,3]。但这些中毒分类系统有些由于开发过早,毒物谱太窄,已明显不适用于当前中毒诊治过程。有些只是对毒物进行简单的分类,没有考虑到不同中毒表现对不同毒物和中毒剂量的表现形式,造成诊断不准确。且已有中毒分类系统只能应用于有限的地域空间,不能满足广大基层特别是农村地区的应用要求,而这些地区往往是中毒的高发地域,此类地区急救医生的毒物诊断及中毒抢救知识又明显不足。因此,利用计算机技术和现代医学理论知识相结合的方法开发基于Internet的毒物分类系统,将其利用于急性中毒临床诊断救治过程,是一项非常有意义的工作。这一系统的应用能使医务人员通过网络输入病人的中毒表现(中毒表现、体征,包括实验室结果)快速获得可能的中毒毒物名称,并给出相应的确诊方法及对应的规范解救措施,从而达到提高抢救成功率、挽救病人生命的目的。我们根据不同中毒表现(包括实验室结果)对应不同毒物的权值向量,利用这些向量构成“中毒表现加权向量表”并将它作为训练数据集的属性值。构建中毒表现向权向量表的P树,并选择HOBBit距离作为距离度量标准,运用P-trees kNN分类算法进行毒物分类。将该方法应用到毒物中毒分析系统中,运行效果良好。

毒物数据库是毒物分类、中毒分析的基础,其建立过程是在医学专业人员的支持下通过对相关资料进行收集、分析和抽象,将其转化成二维关系表,采用特定的数据格式进行存储,最终形成数据库。资料的完整性和准确性是建立毒物数据库的重要前提条件。资料的来源很多,重要的是对现有信息资源、数据库的利用。为了方便计算统计和检索,我们对原始中毒表现数据进行了一些处理。对于同一种中毒表现的不同表述,我们进行了整理。例如将“发烧”规范成医学专业用语“发热”,将“头晕、头昏”等中毒表现合并成“头晕”等,在此基础之上对各种中毒表现进行统一编号。同时为了解决同一中毒表现的不同表述问题,建立同义词库,将同义词给予相同编号,当医生提交初步检查中毒表现集时,首先从同义词库中获取标准中毒表现相应编号,然后再做后续处理。

为了验证上述算法的效果,我们利用已收集的毒物数据库对算法进行实验验证。已收集毒物数据共包括110种毒物,446种中毒表现。开发环境:Eclipse 3.1+、SQL Server 2000,采用B/S结构。毒物数据库包含中毒表现加权向量表(110×446)、毒物中毒表现同义词表、中毒表现表、毒物数据表。当医生或其他用户提交已呈现中毒表现集,系统能按照中毒可能性从大到小依次返回分类结果。

实验中的变量说明如下:统计每一种中毒表现在整个毒物

上一篇:浅谈汽车检测的意义与提高检测水平的有效途径 下一篇:浅析P2P安全问题及防御体系建设