中医药临床随机对照试验文献结构化信息的自动化提取及信息质量评价
收藏资源简介
目的为提高中医药临床随机对照试验(RCTs)文献中数据信息的利用率,本研究对纳入文献中存在的结构化信息进行自动化提取并对提取到的信息进行评价。方法对1986年1月至2020年12月中国知网、万方数据库和维普网中糖尿病、类风湿性关节炎、肥胖、膝骨关节炎、小儿腹泻、结直肠癌6个病种的中医药临床RCTs文献进行检索及梳理,随机纳入5506篇,运用光学字符识别技术对可携带文档格式的文献进行识别,转化成文本格式,并使用正则表达式对文献信息进行提取。从信息的提取率和准确率两方面进行评价。结果研究发现“资料”“方法”“试验参与者总数”“试验参与者年龄”“试验参与者例数”“疗程天数”“排除标准”“纳入标准”和“基金”9个字段的提取率分别为96.60%、93.30%、92.60%、42.23%、28.29%、80.20%、62.60%、46.00%、21.10%,9个字段的准确率分别为97.9%、98.9%、89.7%、100.0%、100.0%、94.5%、97.3%、89.0%、94.7%。结论中医药临床RCTs文献可以通过自动化方式对文献结构化信息进行完整性的识别与判断,提取出的结构化信息可以为中医药临床RCTs网络体系搭建提供数据支撑,在此基础上提出了中医药临床RCTs文献结构化写作设想。
资料为PDF文档格式.
本文档关键词:随机,自动化,提取,中医药,对照