宫颈难!“攻颈”难!——南京市居民HPV及其疫苗认知情况调查分析

发布者:陆敏发布时间:2021-05-23浏览次数:56


一、摘要


宫颈癌,是最常见的妇科恶性肿瘤,高发年龄为3035岁,而且近年来其发病还有年轻化的趋势,其高发病率及高死亡率极大地威胁了女性健康,属于严重的妇科疾病,宫颈癌给我国乃至全世界都造成了沉重的社会经济负担。人乳头瘤病毒(human papilloma virus,HPV)尤其是高危型HPV与宫颈癌前病变和宫颈癌密切相关,HPV疫苗的出现无疑给广大女性带来了福音。HPV疫苗作为公认的宫颈癌防治的有效途径,也是国内外广泛研究的对象,当前对HPV疫苗的研究主要针对高危型HPV,该疫苗主要有二价、四价和九价三种类型。然而目前,中国HPV疫苗接种覆盖率极低,相比较欧美等发达国家,我国在宫颈癌疫苗推广力度上仍有较大差距,这可能是影响疫苗覆盖率的原因之一;此外,民众对疫苗种类的选择、接种的最佳年龄及疫苗接种程序与价格等多种因素存在的困惑,也一定程度上影响了疫苗的接种。那么现阶段人们对于HPV疫苗的评价如何?认知程度如何?我国相关部门对于HPV疫苗的发展应该做出哪些相应的措施?本文为了进一步了解当前我国HPV疫苗的市场状况以及未来发展方向展开了相关调查。

为研究上述问题,本研究团队将传统统计方法与现代机器学习相结合,制定了科学合理的调查方案。本次调查中,我们采用了文献调查、问卷调查、访问调查以及爬虫技术采集数据,并运用传统的描述性统计方法、Logistic回归模型、聚类分析、因子分析、自然语言处理、XGboost算法、多层感知机分类器、LDA主题分析等多种机器学习和深度学习的算法处理和分析数据。

首先,我们对农村居民以及已经接种过HPV疫苗的人群进行半结构式访谈,主要是为了了解居民在接种过程中遇到的问题和诉求以及在宣传薄弱的地方群众对于病毒和疫苗的了解,实际地了解群众最直接的想法。采用半结构式访谈主要是可以根据访谈时的实际情况灵活地做出必要的调整,可以更大程度上获取信息。通过访谈可以发现大部分随机挑选的郊区民众都对HPV及其疫苗知之甚少,所了解的知识仅限于模糊的了解HPV疫苗和妇科疾病有关。绝大部分获取相关信息的渠道都是网络平台,少有了解或知晓政府相关宣传。访谈员对受访民众科普了HPV疫苗相关信息后,绝大部分受访者都对此表现出了兴趣,且表达了考虑给家中亲人预约接种的意愿。同时,价格因素仍是群众考虑接种疫苗与否的一个关键因素。

其次,为更进一步了解人们对于HPV疫苗的真实态度,我们通过爬虫技术,成功抓取到关于HPV疫苗微博较热门的博文下有效热点评论,对数据进行清洗后,绘制了高频词的词云图,结果显示出人们对于疫苗和新冠疫苗之间冲突的关心。之后进行LDA主题分析,对文本评论数据的情感倾向进行判断,主题分析结果表明微博评论数据也显示了大部分人们关心的是疫苗接种和新冠疫苗之间是否有冲突,此外还有疫苗接种时间间隔等问题;对评论进行情感倾向分析可以得到情感倾向中偏消极的评论也较多,推测出现阶段人们对于HPV疫苗的效果及安全性尚有顾虑。

再次,为了解人们对于HPVHPV疫苗的认知程度,获取更深层次影响人们接种疫苗意愿的因素,我们以南京为例,对居民发放问卷进行了调查。针对问卷调查的数据,首先,我们运用了描述性统计方法,对HPV及其疫苗的认知情况、HPV疫苗的接种意愿、HPV疫苗的宣传水平进行研究,发现南京市居民对HPV及其疫苗知晓率低,当前我国主要是通过微博、微信和报刊等渠道来宣传HPV疫苗,其他方式宣传很少,很大程度上影响了HPV疫苗的推广;其次,借助二元选择模型得到愿意接种HPV疫苗的人口特征,运用聚类分析和因子分析,得到影响HPV疫苗接种的主要因素,发现不同消费水平群体对HPV疫苗的接受程度是完全不同的,月消费水平越高,接受程度也越高,此外,高学历人群的接受程度比低学历的接受程度也更高;再次,为得到哪些变量对于人们去接种HPV疫苗的分类有较大的影响,我们运用迭代特征选择的思想,选择XGboost模型进行迭代循环选出较为重要的几个特征,进而构建多层感知机分类器来对所选择特征的分类效果做了更进一步的检验,可以得到,个人的教育水平、家庭收入、身体健康状况以及对于疫苗的了解程度是较大程度上影响人们去接种疫苗的因素。

最后,针对调查结果我们也从疫苗的宣传推广与国家层面两方面提出了相应的建议。宣传推广上,应更加注重 HPV 疫苗宣传覆盖面,打破男性群体对 HPV 的无知,充分利用电视、网络、学校和社区等传播媒介,加强对 HPV 及其疫苗的宣传推广工作,突出疫苗的有效率,降低人们对疫苗副作用的顾虑;国家层面上,应尽快将 HPV 疫苗加入医保和国家免疫计划中,降低疫苗费用,优化 HPV 疫苗审评审批流程,普及 HPV 筛查意识,加速推进“疫苗+筛查”组合 。

综上,本次调查不仅具有一定的经济意义、文化意义以及社会意义,并且具有一定创新性和政治意义,有利于让社会公众加深对HPV以及其疫苗的了解,帮助公众增强卫生意识,提高人们的生活水平和质量,推动健康中国建设,更好地巩固和发展中国特色社会主义。


关键词HPV疫苗;文本挖掘;LDA主题分析;半结构式访谈;XGboost;多层感知机


二、研究主要流程


      1. 研究背景及意义

      2. 文献研究

      3. 问卷的调查及实施

      4. HPV疫苗的半结构式访谈

      5. 基于微博热点关于HPV评论的文本挖掘

      6. 南京市居民HPV及其疫苗的认知及接种情况分析

      7. 结论及参考建议


三、分析及主要结论


(一)背景概要


在女性恶性肿瘤中,宫颈癌(Cervical cancer)的发病率仅次于乳腺癌,是我国1544岁女性常见恶性肿瘤中第二名,也是世界上女性第四大常见的恶性肿瘤以及女性恶性肿瘤死亡的第四大原因。据WHO最新统计,2018年世界范围内新增宫颈癌病例约57万例,死亡约31万人;2015年我国宫颈癌新发及死亡病例数分别为9.89万例及3.05万例。全球每年新发病例近60万,死亡约30万。在世界范围内,平均每分钟就检查出一个患者,每两分钟就有一名女性死于宫颈癌。

数据来源:北京华经视点信息咨询有限公司

2014-2018年中国女性宫颈癌患病人数


数据来源:中国卫生健康统计年鉴

2013-2019年中国女性宫颈癌患病率


中国每年新增病例约13.5万,其中8万人因此死亡,多数宫颈癌患者在发现时已经是晚期,超过一半的患者会在5年内死亡。宫颈癌的高发病率及高死亡率极大地威胁了女性健康,其防治也必然与人民健康息息相关。研究表明,99.7%的宫颈癌是由人乳头瘤病毒(HPV)感染所致,HPV感染非常普遍,有性生活的妇女一生中感染过一种HPV的可能性高达40%80%。可见,对HPV的预防及治疗更是宫颈癌防治的重中之重。

HPV疫苗是目前唯一一款可以预防癌症的疫苗,宫颈癌也并非不治之症,及时进行科学有效的预防,宫颈癌对于女性的危害将会大大降低。因此,面对我国HPV疫苗接种覆盖率低、居民认知程度低等问题,了解居民对HPVHPV疫苗的认知情况及态度、提高大学生对HPVHPV疫苗的认识是当务之急,只有清楚并解决这些问题才能打破宫颈癌防治与疫苗推广的窘境与僵局。


(二)文献研究结论


      通过梳理关于HPV疫苗相关文献,发现目前HPV预防性疫苗在我国面临的问题:

      1. HPV疫苗的价格过高。

      2. HPV疫苗的认知度和接受度低。

      3. 疫苗的安全性存在较大质疑。


(三)问卷的调查及实施


      1. 调查对象:南京市常住居民总体。

      2. 调查方法:文献调查、问卷调查、访问调查、爬虫技术。

      3. 抽样结果:采用概率抽样的方式。概率抽样方法遵循了随机性原则,可以很好地排除主观任意性或目的性,并且为了减小抽样误差,首先进行分层抽样将11个行政区划分为两层,又为了使每个调查单位有同等的入样概率,我们对每层采用了三阶段不等概率PPS抽样,抽样结果如下:


居民社区抽样框

总体分层

第一阶段的入样行政区

第二阶段的入样社区


经济发达区

江宁区

双岗社区

龙都社区

高庄社区




栖霞区

进士坊社区


尧安新村社区


建邺区

莲花北苑社区

虹苑社区



经济欠发达区

雨花台区

景明佳园第一社区


六合区

紫霞社区

四柳社区



浦口区

高丽社区

城东社区




(四)HPV疫苗的半结构式访谈结论


      1. 郊区民众对HPV疫苗的了解程度与接受程度

通过访谈发现,大部分随机挑选的郊区民众都对HPV以及HPV疫苗知之甚少。大部分人获取相关信息的渠道都是网络平台,少部分是身边朋友,几乎没有受访者表示从村里听到过关于HPV疫苗的宣传,这从侧面反映了目前政府对于HPV疫苗的宣传效果与预期相差甚远。值得注意的一点的是所有的男性受访者都对男性可以接种疫苗这一点完全不了解。

在访谈员对受访民众科普了HPV疫苗相关信息后,绝大部分受访者都表达了考虑给家中亲人预约接种的意愿。即使了解到疫苗的价格以后,一部分受访者仍愿意在合适的情况下考虑接种。少部分受访者表达了对国家能够尽快推出具有价格优势的国产疫苗的期盼。这说明价格因素是群众考虑接种疫苗与否的一个关键因素。如果价格合适,几乎所有受访者都愿意考虑自己接种或给家中亲人接种。值得注意的是,在访谈员对受访民众科普了HPV疫苗相关信息后,绝大部分受访者都对此表现出了兴趣,且表达了考虑给家中亲人预约接种的意愿。且大部分受访者在了解到疫苗的价格以后,都表示进口疫苗价格有些昂贵,但仍愿意在合适的情况下考虑接种。只有少部分受访者在了解到疫苗价格以后表示暂时不会考虑这方面的需求,且都表达了对国家能够尽快推出具有价格优势的国产疫苗的期盼。这说明价格因素是群众考虑接种疫苗与否的一个关键因素,且如果价格合适,几乎所有受访者都愿意考虑自己接种或给家中亲人接种。


      2. 已经接种或预约疫苗的群体的接种经历

受访者们普遍接种或预约的都是九价,且都对HPV的传染途径和可能造成的后果有相当程度的了解。受访者普遍是通过网络平台如公众号、知乎、微博等方式了解的HPV相关知识,少部分是通过身边朋友。受访者普遍认同政府应加大对社会民众进行相关知识的普及。大部分人认为接种的价格处于可以接受的范围内,但也都表示希望政府可以将HPV疫苗纳入医保。另一方面,一部分受访者表示在接种过程中曾经出现过头晕,胳膊肿胀等不良反应,并希望国产疫苗能在这一方面做出较大的改善。

       除去价格因素,预约过程难是另一大难题。受访者普遍认为宣传不到位是一方面,更重要的是国产疫苗的产能不够,大部分受访者都只能接种进口疫苗。接受采访的志愿者中有约一半是去往香港或者国外接种的疫苗,由此产生的费用也更加高昂。


(五)基于微博热点评论的结论


        1. 微博词云图结果

微博评论词云图


微博评论中人们比较关心的有疫苗接种和新冠之间的关系、疫苗接种间隔等,长痘、预约、第一次等也是高频词汇。群众们普遍对于新冠肺炎对疫苗的影响十分关注,认为新冠肺炎可能会影响到疫苗的效用,或者担心新冠疫苗与HPV疫苗是否可以同时注射,此外,对于HPV疫苗的难预约有较多的发声。可以看出总体来说人们对HPV疫苗还是有很多疑问的,大部分高频词都是有关疑问的词。


2. 情感倾向分析结果

微博评论的SnowNLP评分


       对所得的729个评论进行SnowNLP评分,可以得到有376个评论分值低于0.3,较消极;有182个评论分值大于0.7,较积极,可以看出评论中消极的评论较多,体现人们对于该疫苗还是抱有更多的疑问,不放心的言论较多。


      3. LDA主题分析结果


LDA主题分析结果

主题1

主题2

主题3

0.013*疫苗

0.095*疫苗

0.030*长痘

0.012*微博

0.035*新冠

0.021*

0.011*转发

0.031*接种

0.019*

0.011*

0.027*HPV

0.016*一点

0.010*

0.021*间隔

0.015*女孩

主题一中的高频特征词为疫苗、微博、转发、完、约,可见该主题主要反映的是网友们对于HPV疫苗信息传播的关注;

主题二的高频词为疫苗、新冠、接种、HPV、间隔,主要是反映人们对于HPV疫苗与新冠肺炎疫苗之间是否有冲突的关心;

主题三的高频词为长痘、完、约、一点、女孩,主要反映的是对于HPV疫苗和其可能有的其他可能影响之间关系的关注。


(六)南京市居民HPV及其疫苗的认知及接种情况分析


1. HPV及其疫苗认知情况描述统计

HPV认知情况


       被调查者大多对于HPV的了解不多,占比56.44%,超出了总人数的一半;另外还有15.57%的被调查者对于HPV从未听说;仅有27.9%的被调查者对于HPV比较了解或是非常了解,这反映出,居民对于HPV的了解程度偏低。



HPV疫苗认知情况


被调查者大多对于HPV疫苗的了解不多,占比52.39%,超出了总人数的一半;另外还有22.05%的被调查者对于HPV疫苗从未了解;仅有25.56%的被调查者对于HPV疫苗比较了解或是非常了解,这反映出,人民群众对于HPV疫苗的了解程度较低。

问卷受访者的HPV疫苗接种情况


由上可以看出,被调查者中未接种HPV疫苗的人群占绝大多数,男性高达96.32%,女性高达82.66%,其中接种过和正在预约HPV疫苗的人群占比很小,女性相对更加倾向于接种HPV疫苗。虽然男性对于HPV疫苗的感染概率较低。但据调查,男性注射HPV疫苗也有重要意义。HPV疫苗能够有效预防生殖器湿疣(尖锐湿疣)、肛门癌等疾病、同时男性接种HPV疫苗不仅仅可以保护自己,更可以降低HPV的传播,从而避免伴侣感染HPV

问卷受访者的HPV疫苗接种意愿


由上可以看出,女性愿意接种人数达64.97%,男性愿意接种人数达35.30%,女性更加倾向于接种HPV疫苗,大部分女性都愿意接种HPV疫苗,但由上面分析发现,男女接种HPV疫苗的比例很少。

问卷受访者愿意主动接种HPV疫苗的原因


由上,可以看出在所有受访者中愿意主动接种HPV疫苗最重要的原因是担心自己将来感染HPV,占比65.98%,而选择自己可以从中受益的人数最少,仅占16.29%,这表明受访者愿意接种HPV的主要原因是担心自己感染HPV

问卷受访者不愿意接种HPV疫苗的原因


由上图可以看出,被调查者不愿接种HPV的原因,主要是不清楚疫苗的安全性和有效性,所选人数占48.33%,其次是接种不便捷,所选人数占46.71%,随后占比较高的分别是疫苗还没有大面积推广、疫苗价格昂贵、以及怀疑疫苗的来源。这表明被调查者,不愿接种HPV的主要原因有三:第一,对HPV疫苗的相关知识还不了解;第二,HPV疫苗接种不便捷,由于HPV存量少,并且就地接种,这就造成了疫苗接种的不便。第三,疫苗价格昂贵,使得接种HPV疫苗成了负担。

问卷受访者对不同产地HPV疫苗的可接受价格


对于进口、国产疫苗接种可接受价格的调查发现,两者可接受价格十分接近,大多数被调查者都选择小于1000元,分别占69.67%69.94%,选择其余选项的占比较少。这表明,人们更愿意接受HPV疫苗接种价格低,因此价格成为疫苗接种的所考虑的问题。

问卷主观题的词云图


 根据主观题的词云图我们可以对受访者者的评论可以直观的归纳为以下几点:(1)疫苗接种的价格过高;(2)疫苗相关知识宣传不够;(3)疫苗产量太低,供不应求;(4)预约时间太久;(5)疫苗副作用不了解。


       2. 基于二元选择模型的意愿接种人群特征分析


Logit模型最终回归结果

变量

回归系数

标准误

wals

P

OR{Exp(B)}

常数项

-0.370

0.061

36.672

0.000

0.691

college

0.594

0.294

4.086

0.043

1.811

cost_2000-4000

-0.645

0.292

4.899

0.027

0.524

cost_4000-8000

-0.582

0.288

4.074

0.044

0.559

cost_8000-12000

-0.598

0.292

4.178

0.041

0.550

       模型结果分析:

      (1)本科学历意愿接种人数的频率相对于初中及以下学历更高。

      (2)月消费水平越高,接种HPV疫苗的意愿越高。


      3. 基于聚类分析的HPV疫苗接种意愿群体特征分析


愿意接种人群聚类中心表

愿意接种人员类型

性别

年龄

27-35

18-26

27-35

27-35

学历

大学专科

大学本科

大学专科

大学本科

月收入

9000-12000

3000元以下

6000-9000

9000-12000

月开销

4000-8000

1000-2000

2000-4000

8000-12000

居住地

农村

城镇

城镇

农村

婚育状况

已婚未孕

恋爱未同居

恋爱未同居

恋爱未同居

性生活状况

体质

正正常常

正正常常

正正常常

正正常常

宫颈癌家族史

       聚类结果分析:

       第一类人群:这类群体主要是农村已婚未孕的女性,年龄在27-35岁之间,具有大学专科学历,月收入及开销水平都处于中上游

       第二类人群:这类群体主要是在校本科女大学生,居住在城镇,月收入和开销水平由于较低水平,且已经恋爱,并未同居。

第三类人群:这类群体主要是居住在城镇的上班族女性,年龄在27-35岁之间,具有大专学历,月收入和开销水平处于中等水平,且已经恋爱,但未同居

第四类人群:这类群体主要是居住在农村的高收入高消费女性,年龄在27-35岁之间,具有本科学历,同样已经恋爱,并未同居。


      4. 基于因子分析法的影响HPV疫苗接种因素分析


因子载荷矩阵

指标

成分

 

1

2

HPV感染的风险

0.987

0.159

疫苗预防效果

0.992

0.120

疫苗接种的便捷性

0.992

0.046

疫苗副作用的大小

0.956

0.194

对疫苗的相关认知

0.969

0.221

相关医生护士的推荐

-0.930

-0.047

纠结进口还是国产疫苗

0.598

-0.788

社区及周围人宣传

0.912

0.374

疫苗的价格

0.963

0.100

学校教学科普

0.843

0.239

       结果分析:

       第一因子中HPV的感染风险、疫苗的预防效果、疫苗接种的便捷性、疫苗的副作用大小、疫苗的相关认知、疫苗的价格这几个因子具有很高的载荷量。故命名为疫苗安全性和实用性。

第二因子中社区及周围人科普、学校教学科普具有较高的载荷量,故命名为疫苗的宣传普及。


      5. 基于XGboost算法的HPV接种人群特征选择

    (1)XGboost迭代特征选择


迭代特征选择后的变量

变量

是否选入

学历-初中及以下

True

月收入_6000-9000

True

月收入_12000以上

True

体质如何_正正常常

True

是否有宫颈癌家族史_

True

是否做过宫颈癌的筛查_

True

是否曾接触HPV疫苗有关的宣传普及_

True

是否了解HPV_非常了解

True

是否了解HPV疫苗_比较了解

True

认为现有的疫苗知识的宣传普及_效果很好

True

    

      (2)多层感知机交叉验证结果


交叉验证均值

层数

alpha

5折交叉验证均值

2

0.01

0.769

2

0.1

0.777

2

1

0.820

10

0.01

0.713

10

0.1

0.702

10

1

0.723

100

0.01

0.744

100

0.1

0.735

100

1

0.731

       结果分析:

可以看出当多层感知机层数为2,正则化参数alpha1时,模型的交叉验证均值为0.820>0.8,说明该模型参数选择的泛化性能更好,更有利于对上述选择的10个特征的人口进行分类,通过XGboost算法选择的10个特征对于居民接种是否接种HPV疫苗有确实有很大程度的影响。


(七)政策建议


1. 加大HPV疫苗宣传覆盖面,打破男性群体对HPV的认知。

2. 充分利用电视、网络(微博、微信等)、学校和社区等传播媒介,加强对HPV及其疫苗的宣传推广工作。

3. 突出疫苗的有效率,降低人们对疫苗副作用的顾虑。

4. 尽快将HPV疫苗加入医保和国家免疫计划中,降低疫苗费用。

5. 优化HPV疫苗审评审批流程,解决 “预约难”问题。

6. 普及HPV筛查意识,加速推进“疫苗+筛查”组合。