魏矿荣1 ,徐红燕2 ,梁智恒1 ,刘慎超2
中山市人民医院肿瘤研究所;
广州泓维软件有限公司
摘要 肿瘤登记非常重要,但面临许多问题与挑战,严重影响肿瘤资料的收集、整理和应用。虽然现有肿瘤登记软件带来较大便利,但未能充分体现信息化应有的优势和特点。引入BI技术实现肿瘤登记自动化,不仅有效解决了上述问题,大大减少了肿瘤登记人力、物力和财力投入,最重要的是其技术和理念可以在医学领域广泛推广应用,推动医学及其信息化的发展。 关键词 肿瘤登记;自动化;医学
日常运作产生海量医学数据,难以用常规方法进行分析处理,而这些数据对政府卫生政策制定,公共卫生机构疾病流行规律掌握和有效防治,医院运营决策、风险防范和临床医生科研、疗效评价等具有非常重要意义。因而,数据的收集、处理、分析和研究成了发现、分析和解决问题的关键。数据搜集和分析从最初手工操作发展到今天的信息化手段,可从浩瀚数据海洋中快速准确收集和分析所需信息,为实际工作提供巨大便利。但是,总体而言,医学数据的搜集、分析和利用仍然不够方便快捷,仍然没有充分发挥信息化应有的作用和特点,对数据的处理仍然需要相当的人工干预或操作。为推动医学和信息化的发展,充分发挥BI等信息技术的作用,本文从肿瘤登记方法演变,中山市人民医院采用BI技术从医院电子数据库自动查找、收集、整理、编码和统计分析肿瘤资料,探讨了肿瘤自动登记理念与BI技术在医学领域的推广应用。 一、肿瘤登记面临挑战和方法演变 肿瘤危害性越来越大,严重影响居民生命健康,因而肿瘤防治越来越重要[1]。而要有效防治恶性肿瘤,首先必须掌握恶性肿瘤流行规律与特点,做好肿瘤登记。所谓肿瘤登记是长期、连续对肿瘤资料进行收集、整理、储存、统计分析,找出其流行规律,并提出防治建议的过程。肿瘤登记主要包括资料收集(包括核对)、编码和利用三个关键环节,其中资料收集与核对是最重要和最困难的环节。传统肿瘤资料收集方法主要有被动和主动收集两种方法,被动方法是医务人员在诊治过程接触到肿瘤资料时,填卡上报肿瘤资料,而主动收集是登记人员去有关单位和部门查找、收集肿瘤资料。 国内过去主要采用被动登记为主的方法,但由于医务人员越来越少上报资料,因而逐步演变成以主动登记为主的方法,部分登记处甚至完全依赖主动登记方法。但传统主动登记方法面临许多问题与挑战,挑战之一是肿瘤资料的收集与整理不仅非常辛苦、烦琐、费时,且不断累积的资料越来越难以用人工甚至是半人工方法进行整理;挑战之二是肿瘤资料编码复杂、困难,难以保证编码的准确性;挑战之三是由于登记人员疲于资料的收集、核对、编码和上报,无暇充分利用登记资料[2-4]。 由于IT技术和医学信息化发展,医院网络、医生工作站、电子病历和PACS等系统普遍应用,传统肿瘤登记方法渐被现代方法取代,手工和纸质操作渐被电脑和软件取代,网络直报代替了人工卡片上报,从电子数据库中筛选、下载和拷贝肿瘤资料的现代主动登记方法代替了传统人工查找和抄写的主动登记方法,大大减轻了肿瘤登记人员工作。虽然IT技术和医学信息化改变了肿瘤登记方法和模式,但现代登记方法也存在明显不足,网络直报没有减轻临床医生负担,而现代主动登记方法容易产生漏报,花费时间仍较多。为了能更好的简化肿瘤登记工作,减轻临床和登记人员的压力与负担,肿瘤登记软件应运而生[5]。二、肿瘤登记软件的涌现与应用 国内外非常重视肿瘤登记软件的研发。国内河南省肿瘤防办最早开展此方面的研究,1985年即在IBM-PC(XT) 机上研发了《恶性肿瘤及居民病伤死亡原因微机处理系统》,而全国肿瘤登记中心2002年汉化了国际癌症研究所(IARC)/国际癌症登记协会(IACR)的CANREG4登记软件,并在全国推广使用。其后,上海、大连、北京、广州、南京市雨花台区]和深圳等地也开发了肿瘤登记系统。2011年王庆生教授与全国肿瘤登记中心合作研发了《中国肿瘤登记数据管理与分析系统》,并在全国推广使用。IARC/IACR为了方便肿瘤登记,推出了CanReg和CHECKTools等软件,美国国立癌症研究所研发了许多主要用于统计分析的肿瘤登记软件 ]。此外,国外一些肿瘤登记处和地区如美国密歇根大学医疗卫生系统、意大利瓦雷泽肿瘤登记处和威尼斯肿瘤登记处进行了肿瘤自动登记的研究。国内研发肿瘤登记软件功能主要集中在资料收集后的处理,如录入、整理、储存、编码和统计分析,缺乏自动处理功能。国外件功能尤其统计分析虽然强大,也具有一定自动功能,但由于语言和环境不同,难以在国内套用[5]。 总而言之,肿瘤登记软件虽然大大简化与便利了肿瘤登记,某些软件也具有全自动登记的雏形[6-7],但是国内现有软件功能仍主要集中在资料收集后的管理与应用,缺乏自动登记的功能。 三、借助BI技术进行肿瘤自动登记随着BI技术在商业领域成熟应用,医院信息化程度不断提高和BI技术逐渐引入[8-11],肿瘤登记自动化成为可能[2-5]。BI本质是采用一系列技术、方法和软件分析企业海量数据,为企业决策提供科学依据,从而提高企业运营能力和竞争优势。商业智能有战略、战术与操作型三种类型,操作型BI主要帮助和简化一线员工日常工作 [12],肿瘤登记自动化即是借用操作性BI技术。BI主要包括数据预处理、仓库建立、分析及结果展现四个阶段:1、数据预处理即从源电子数据库中自动获取所需数据;2、数据仓库建立即将提取、转换后的数据存贮在专门的数据仓库中;3、数据分析即通过联机分析和数据挖掘自动分析数据仓库数据,是BI智能的关键;4、数据展现是采用可视化手段展示分析结果。 借助BI技术进行肿瘤自动登记,首先预处理数据,即从医院电子数据库如电子病历中自动发现、提取、整理和编码所需肿瘤资料,其次建立整理后的数据仓库,再次根据需要进行数据自动分析,最后自动展示分析结果,而肿瘤数据的自动发现、提取和整理是关键所在。肿瘤自动登记软件研发必须具有丰富肿瘤登记和软件开发经验人员的参与,而软件应用也必须具备一定条件,如电子数据库具有一定质量。中山市人民医院信息化程度较高,2004年就基本实现了无纸化运作,所有临床诊治数据均电子化,而且负责中山市肿瘤登记工作43年,有丰富的肿瘤登记经验,具备良好研发和应用肿瘤自动登记软件的条件与基础[5]。 根据BI原理,肿瘤自动登记分成8个阶段:数据库关联、查找、提取、整理、编码、建库、统计分析和结果显示,8个阶段集合即是肿瘤登记全自动化。数据库关联即找出并关联有关电子数据库,查找即根据关键词从数据库中自动发现、查找出肿瘤数据,提取即从查找出的数据中提取所需资料,整理即对提取资料删重、整合和更新,编码即对整理后资料进行国际疾病分类编码,建库即将编码后的资料建立用以统计分析的数据库,统计分析即对资料分析研究,结果显示即简洁直观展示研究结果。软件研发原则是只提取电子数据库资料,并尽量减少对电子数据库和医院工作系统运行的影响。 四、肿瘤资料自动收集的实现 首先进行数据库的关联。和肿瘤资料有关的数据库较多,如电子病历、PACS、LIS、挂号和医保系统等,其中PACS、LIS等系统中的资料最原始,是资料自动收集最重要的数据库,而电子病历、挂号和医保系统等中的资料主要用于资料的补充和核对。其次通过关键词进行资料的自动查找。关键词有两类,一类是国际疾病分类编码,另一类是疾病名称。根据编码查找肿瘤资料比较简单,而根据疾病名称查找比较烦琐和困难,需多次筛选,反复测试。如用癌(症)、恶性瘤、恶性肿瘤作为关键词进行查找时,往往将诊断为未见癌、未见瘤的资料也查出,而以母细胞瘤作为关键词进行查找时,常需进行三次以上的筛选才能正确查找出所需资料。 中山市人民医院与广州泓维软件公司研发的肿瘤资料自动收集软件以疾病名称为关键词,从医院PACS系统中自动收集肿瘤资料。研发软件测试采用手工和软件同步查找方法,以手工收集的结果作为标准。结果显示开发软件收集结果准确性相当高, 3个月数据测试结果的灵敏度为98.91%,特异性为99.22%。除日期因素外,一些少见、罕见之前未能遇见的疾病诊断,在软件编制时未能加以注意,导致了遗漏和假阳性。此外,存在遗漏极少数肿瘤患者资料和错将非肿瘤患者资料当作肿瘤患者资料的不足。 研发软件具有以下优点:1、不影响原有信息系统的运作;2、适用于不同信息系统;3、软件运行速度快,数十秒即可完成查找过程;4、准确性高,灵敏度和特异度均达95%以上;5、可大大减少工作量,使用软件前,中山市人民医院一个月要浏览PACS系统上的诊断记录约5万条,而使用软件后,仅需浏览1500条左右记录。与国外现有软件相比,所开发软件具有较高的准确性,如美国芝加哥研发自动收集软件的敏感性为100%,特异性为85.0%,阳性预测值为78.8%,安太略癌症登记处软件的假阳性率为50%],意大利瓦雷泽自动登记程序的灵敏度为98.7%,有1.3% 的漏诊[4]。五、肿瘤自动登记理念和BI技术在医学领域的推广应用肿瘤登记自动化对肿瘤登记无疑是一场革命,将为肿瘤防治带来巨大影响。既然肿瘤监测可以自动化,那么其它疾病如传染性疾病和慢性非传染性疾病的监测,甚至任何医学过程的监测,以及其他医学数据的提取和分析,是否均可依次类推,利用BI技术自动实现呢?本文作者觉得很有可能。只要电子数据库中存在相关信息,通过关键词,在具有一定信息化程度的环境,理论上均可如肿瘤登记一样,自动进行数据的发现、提取、整理、编码和统计分析。事实上,自动监测早已应用到其他方面,如在影像学诊断中的应用[13]。 实现上述目的主要困难在于:1、原始数据库完整、准确与电子化的程度。电子化是指原始数据必须以电子数据库的方式存在,准确与完整是指源电子数据库必须完整和准确;2、非结构化数据的处理。医疗数据库中大部分甚至绝大部分是非结构化数据,如果不能对非结构化数据进行有效的提取和整理,就难以实现监测的全自动化[14];3、缺乏典型例子。虽然理论上可以实现监测的全自动化,但缺乏典型例证,难以令人信服;4、研发软件的效率[5]。
参考文献
1、杨玲. 国际与国内肿瘤登记概况[J].中国肿瘤,2005,14(12):772-775. 2、魏矿荣,梁智恒,任小青.肿瘤资料搜集方法的创新[J].中国肿瘤,2009,18(7):528-530. 3、梁智恒,刘静,魏矿荣.对肿瘤登记工作的一些看法[J].中国肿瘤,2010,19(12):779-781. 4、梁智恒,刘静,王亚娜,等.肿瘤资料收集自动化的研发和应用[J].中国肿瘤,2012, 7(21):488-490.5、魏矿荣,梁智恒,刘静等.肿瘤商业智能在肿瘤登记中的应用[J].中国肿瘤.2012,7(21):484-487.6、Giovanna Tagliabue, Anna Maghini, Sabrina Fabiano, et al. Consistency and accuracy of diagnostic cancer codes generated by automated registration: comparison with manual registration[j]. Popul Health Metr,2006,4:10.7、Paolo Contiero, Andrea Tittarelli, Anna Maghini, et al. Comparison with manual registration reveals satisfactory completeness and efficiency of a computerized cancer registration system [J]. Journal of Biomedical Informatics, 2008,41: 24�32. 8、黄波.Office在医院商业智能中的应用[J]. 现代医院,2009,9(2):131-133. 9、丁玉琪,武君胜.商业智能在医院信息系统数据深加工中的应用[J].中华医院管理杂志,2005,21(4):250-252. 10、陆慧菁,肖安.商业智能在医保分析中的应用[J].医学信息,2010,23(4):799-801.11、苏韶生,程敏婷,张淑娟.大型医院开展数据挖掘项目存在的问题及对策[J].2010,25(8):59-60. 12、陈磊,董碧丹,张峰.操作型商业智能综述[J].计算机工程与设计,2010,31 (7) 1639-1642 13、Folio LR, Choi MM, Solomon JM et al.Automated Registration, Segmentation, and Measurement of Metastatic Melanoma Tumors in Serial CT Scans[J]. Acad Radiol,. 2013, Mar, Epub ahead of print 14、邱明辉,彭强.非结构化信息管理框架的原理与应用[J]. 情报探索,2011,159(1):93-95.