- +1
旅游统计科普小知识 | 国内旅游统计现状分析与提升路径(四)
旅游统计数据是研判一个国家或地区旅游业发展规模、发展质量的“监测器”,数据质量的高低会直接影响到政府、业界及学界对国家或地区旅游业发展的正确研判。由于旅游业是从需求端界定的行业,隐含在国民经济行业分类之中,并不是各级政府统计的直接对象,旅游统计数据的质量高低对各级政府主要统计数据并无直接影响,因此,旅游统计工作长期以来并未受到各级政府领导的重视。旅游的产业边界是根据游客消费涉及的行业来界定的,涉及“食、住、行、游、购、娱”等众多方面。尽管我国旅游主管部门按照UNWTO推荐的《国际旅游统计建议2008》《旅游卫星账户建议的方法框架2008》修订了我国旅游统计调查制度,指导着我国的旅游统计工作,但不论在学界还是业界总是有对官方发布的数据的质疑声音,比如质疑国内旅游统计数据的“横向不可比、纵向不可加”“国内游客统计口径太过宽泛”“旅游统计数据水分太大”等。以上对于旅游统计数据的质疑,有的是由对旅游统计复杂性的认知偏差导致的,有的是由从不同学科背景对旅游、旅游者、游客等基本概念的认同差异导致的,有的是由传统的抽样调查和基层填报调查方法的局限性导致的。各界对于旅游统计数据的质疑主要聚焦在国内旅游的统计数据,尤其是地区国内旅游统计数据的准确性。随着我国进入社会经济新时代,外部环境的不确定性,扩大消费需求成为拉动我国经济发展的重要动力,而旅游消费作为多层次、多样化、可持续的服务性最终消费,也成为各级政府拉动经济的“香馆馆”。因此,国内旅游统计数据的准确性直接关乎国家或地区旅游发展战略决策及地区旅游业健康发展。本文将通过对国内旅游统计数据的生产过程中导致数据不准确的因素分析入手,从统计数据生产的主要环节探讨国内旅游统计数据质量的提升路径。
二、国内旅游统计数据质量的影响因素分析
(一)统计调查方法对数据质量的影响分析
1. 抽样调查的数据质量分析
抽样调查是获取不同地理尺度国内旅游统计的人均次花费、人均天花费的基础数据的主要方法,主要包括居民出游情况抽样调查、地方接待国内游客花费抽样调查。由于目前采用的是人工或电话调查方法,虽然有预先设计的科学的调查方案,但仍有以下因素会影响到调查数据的质量:
(1) 问卷调查填写中的主客观因素对数据质量的影响
一方面是被调查对象是否愿意如实填写会影响调查的数据质量,另一方面就是填写数据的准确性。目前的统计调查方法,无论是居民出游调查,还是接待地国内游客花费调查,都是通过被调查对象回忆某次或某个时间段内旅游花费情况,尤其是国内居民出游调查,每季度进行一次,回忆最后一次出游的花费情况。虽然目前电子支付越来越普及,无论预订还是现付都会留下消费记录,相比较纸质货币支付时代,游客旅游花费调查数值的准确性上要有一定程度提高。但回忆调查法存在固有的缺陷,根据人的遗忘规律以及旅游过程的场景多样化,大多数人旅行过程中的各种花费很难准确记忆。
(2) 样本量偏少,影响到样本的代表性及总体的准确性
由于调查经费的限制,我国旅游统计调查制度中国家层面国内居民出游抽样调查每年样本量为8万个,较之当前超过60亿人次的出游人数,调查样本显然偏少。各省接待国内市场花费抽样调查样本量为上一年度该省接待国内市场规模的万分之三,各省在执行时还存在样本量打折扣的情况,一定程度会影响经由样本推算总体的质量。同时,由于传统的人员调查方法成本高、效率低,随着信息技术及移动互联网的发展,网络调查成本低、反馈快的优点凸显,增大样本量已完全有可能。
2. 基层报表数据质量分析
现行的旅游统计调查制度中,旅游饭店、旅行社、旅游景区的基本情况、接待情况、财务状况均采用报表的方式获取相关基础数据,在国内旅游统计中主要用来推算过夜游客人数、一日游游客人数。影响基层报表数据质量的主要因素有:
(1)住宿单位名录库不全、更新不及时
过夜游客是由住在商用住宿设施的过夜游客、住在亲友家、自用或免费用于度假的次要住宅的过夜游客构成。因此过夜游客的接待量数据准确性就主要取决于住宿单位纳入统计的名录库的完善程度。目前纳入文化和旅游部联网直报系统的住宿单位规模标准各地不同,即便在同一省份,各地市的标准也不相同,比如:海南文昌市拥有60张床位的住宿单位纳入直报系统,而三亚市则是拥有39张床位的住宿单位纳入直报系统。
(2)住宿单位小微企业及个体户多
随着全域旅游的推进,适应人们旅行方式的变化带来的住宿需求的变化,无论在乡村还是城市,民宿、客栈、公寓式家庭旅馆非标住宿产品的市场份额越来越大。一方面,这类住宿单位多为个体户及小微企业,没有进行工商、税务登记,很难进入监管、统计范围;另一方面,这类住宿单位生灭变化快,因此传统的名录库创建及更新很难触及这类实际存在的住宿单位。
(3)开放式景区增多,对于一日游游客接待人数的统计,传统调查方法难以解决
乡村旅游、旅游小镇、历史街区、旅游综合体、田园综合体等新的旅游形态大多是开放式景区,没有闸机、不收门票,根据传统的统计方法推算一日游游客人数将举步维艰。开放式景区的边界如何确定、游客身份如何认定等技术性问题都是制约传统开放式景区接待人数准确计量的因素,而这些障碍因素恰巧是传统的统计调查方法解决不了的,直接影响到一日游统计数据的准确性。
3. 大数据质量分析
目前各旅游数据中心与相关大数据企业在对数据挖掘过程中应用最广泛的大数据源是运营商数据、银联商务数据、OTA运营数据等。由于大数据的生产过程与政府统计数据生产构成的不同(见表3),在数据清洗、解析及建模方面缺乏国家标准的情况下,将大数据用于国内旅游统计,对旅游统计数据质量有一定程度影响。
运营商数据具有体量大、维度全、准确性高、连续性且可追溯的特点,通过对游客客源、游客行为、旅行轨迹等分析,用来区分不同游客类型,成为推算各类游客接待量的新数据源。同时,通过与银联商务数据的匹配,获取游客消费数据。影响运营商数据质量的障碍主要是缺乏统一的数据筛选标准。根据我国旅游统计调查制度中关于游客界定的技术标准是离开居住地10公里,超过6小时,在运营商数据挖掘中是需要进行界定“在目的地停留多长时间”才算一日游游客等。但目前,国家并未出台运营商数据挖掘的标准,不同数据公司根据各自的标准进行数据挖掘,导致结果混乱,影响运营商数据质量和数据价值。
银联商务数据作为获取游客旅游消费的数据源,相比较通过问卷调查获取的游客消费数据而言,准确性更高,但不是游客在旅游目的地花费的全部数据。
OTA一方面可以提供游客预订信息作为游客消费的数据源,与抽样调查的传统数据相比,该数据的典型性和代表性会受到一定影响。另一方面可以通过网络爬虫技术获取住宿、餐饮、娱乐、景区等单位的位置信息、基本信息、部分经营信息等,大大降低了传统的基本单位名录库建设的时间及费用成本。
表3大数据与传统数据生产过程的比较
比较
项目
大数据生产过程
传统数据生产过程
数据采集
先筛选(筛选标准、方法、指标等),再解析(解析方法标准数据库)
先有设计(调查方案),后有数据
数据处理与存储
数据清洗(杂乱、非结构化)、归类、编辑、编码等,然后再存储(数据处理、存储标准方法库)
数据录入、编码、归类、存储
数据分析与推断
统计+计算(非常复杂的模型)
常规统计模型
原标题:《旅游统计科普小知识 | 国内旅游统计现状分析与提升路径(四)》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




