旅行用品和行程文件——包括护照、登机牌、相机和颈枕——放在行李箱旁的一张木桌上。
所有文章

旅游数据架构:2026年的11层旅游科技架构

Ryan Turner
Ryan Turner · Head of Growth

只需十秒钟就能预订机票,而在此过程中,你不知不觉间已经触及了十几个系统。 一个搜索框悄无声息地查询了建于20世纪70年代的全球分销系统、若干家航空公司的零售API、覆盖地球上几乎所有商业航线的航班时刻表数据源、批发17万家酒店房源的酒店房源库、支付通道以及欺诈检测系统。 2025年,旅游业为全球GDP贡献了创纪录的11.6万亿美元,约占世界经济的9.8%(WTTC(2026年)。在这个数字的背后,隐藏着一个大多数人从未见过的数据堆栈。本篇拆解文章将逐层解析这11个层级,列出定义每一层的公司,并展示官方数据源在何处终止、实时网络数据从何处接手。

要点总结
  • 2025年,全球旅游业对全球国内生产总值(GDP)的贡献达到创纪录的11.6万亿美元,约占世界经济的9.8%(WTTC, 2026)。
  • 三家现有的全球分销系统(GDS)运营商(Amadeus、Sabre、Travelport)仍处理着估计95%以上的GDS预订,但截至2024年,NDC交易量同比增长了约165%(Accelya, 2024)。
  • 旅游业是在线领域中受机器人攻击最严重的行业:2024年,旅游网站流量中约有48%来自恶意机器人,这些机器人专门抓取票价和库存信息(Imperva, 2025)。
  • 目前正在数字化的这些领域(体验、eSIM、附加服务结算)正是未来十年旅游科技发展的核心所在。
The whole pie keeps growing TRAVEL & TOURISM GDP CONTRIBUTION (USD TRILLIONS) $11.6T $16.5T 2025 (actual) 2035 (forecast)

来源:世界旅游及旅行理事会,2026年。

1. 全球分销系统:传统的基础架构

截至2026年,全球航空旅行市场仍主要由三家公司掌控:阿马迪斯(Amadeus)、赛博(Sabre)和Travelport共同处理了全球全球分销系统(GDS)预订量的约95%或更多(未来市场洞察 /《欧洲商务旅行新闻》(2025年)。GDS是旅行社和在线销售商用于在同一平台采购和预订机票、酒店及租车服务的预订系统。这些是整个系统架构中历史最悠久的系统,之所以具有粘性,正是因为所有人都已经与它们建立了连接。

此处的关键参与者是阿玛迪斯,Travelport,Sabre,以及发展迅速的TBO 来自印度。对旅行社而言,问题在于:GDS的接入权限受限,合同条款繁琐,且按业务板块计费。2026年出现的一个耐人寻味的矛盾在于,GDS实际上并未涵盖所有票价。航空公司越来越多地将最优惠的票价放在其他渠道上,这也正是下一层级平台存在的根本原因。

如需查看该生态系统中各公司的完整概况,请参阅我们的旅游数据行业市场图谱.

2. NDC 与航空公司零售:现代产品层

过去几年里,各家航空公司一直在将最优惠的票价从全球分销系统(GDS)转移到新分销能力(NDC)渠道。 这一势头十分强劲:截至2024年,NDC交易量同比增长约165%;据称处理了全球NDC市场半数以上业务的Accelya公司,每天生成300亿余条独特报价(Accelya(2024年)。据行业估计,2024年NDC约占预订总额的五分之一,较一年前的约10%有所上升(TWAI, 2025)。

这是地图上最繁忙、最拥挤的一层。Duffel,Travelfusion,AirGateway,Verteil,TPConnects,PKFARE,Atlas (ATRIP),Mystifly,Kyte……还有十几个聚合平台,它们都承诺提供同样的服务:一个简洁的API,通过单一集成将数十家航空公司的NDC连接所带来的复杂性隐藏起来。 美国航空将其约40%的票价设为NDC独家,因此没有NDC接入权限的销售商根本无法查看这些价格。聚合平台之所以存在,是因为自行与每家航空公司建立连接是一项全职工作,而没有任何初创公司愿意承担这项工作。

3. 航班信息:时刻表、航班状态和票价

预订是一回事;了解实际执飞的情况则是另一回事。参考航班数据本身就是一层极其庞杂的信息,其规模之大令人难以置信。 截至2025年,Cirium每天处理来自约2,000个数据源的约300太字节航空数据,其航班时刻表覆盖范围包括900多家航空公司以及全球约99%的商业航班(Cirium 通过 AltexSoft(2025年)。这就是所有预订工具中“您的航班延误”提醒和航线图背后的数据源。

这些名称根据用途进行分类。OAG 以及Cirium 自有权威的时刻表和换乘数据。FlightAware 以及OpenSky 网络 实时追踪位置。Aviationstack,《航空前沿》,以及AeroDataBox 提供便于开发者使用的 REST 端点,用于查询状态和路由。Traveldax 以及出发 更接近费率智能和交易检测。请注意这种规律:数据的权威性越高,就越依赖于企业级合同;而开发者级别的 API 则以牺牲完整性为代价,换取信用卡支持和快速入门功能。

4. 酒店与房源:床位库批发层

酒店通过“床位库”(bedbanks)进入公开市场,这些批发分销商负责汇总客房资源并将其转售给旅游销售商。 这里的关键数据非常具体:HBX集团(Hotelbeds)为旅游业界提供了覆盖180多个国家、约17万家独特酒店的资源,并向数万家B2B买家进行分销(HBX集团(2025年)。HBX于2025年初在马德里证券交易所上市,这充分说明了这个默默无闻的中间层蕴藏着多少资金。

定义集的范围很广:Hotelbeds (HBX),WebBeds,RateHawk,World2Meet,Expedia Rapid,该Booking.com 合作伙伴 API,以及专注于连接性的企业,例如TravelgateX,斯图巴,亚拉戈,以及G2 Travel. 对于任何基于这一层进行开发的人来说,一个反复出现的问题是:房价和房源情况不断变化,且因客源市场而异。同一间客房的定价会根据预订者的地理位置而有所不同,这使得酒店定价成为一个需要实时数据处理的问题,而非依赖静态数据源的问题。

5. 专项数据:附加服务、航班中断、二氧化碳排放及联程运输

在核心数据源之外,还存在一层专业数据,而大型系统对此处理不力。随着旅客和监管机构对碳排放施加压力,以及航空公司追逐附加收入,这一利基数据正迅速变得有价值。仅附加服务一项,如今就已成为一项巨额业务: 预计2025年全球航空公司的辅助收入将创下1570亿美元的纪录,高于2024年的1484亿美元,目前约占航空公司总收入的15.7%,而2016年这一比例仅为9.1%(IdeaWorksCompany 和 CarTrawler, 2025)。

这里的企業既精明又專業。TripStack 支持虚拟联程处理,将不同航班拼接成一个行程,而这些航班原本是航空公司从未捆绑销售过的。FlightRadar24 的 API 公开了其追踪数据流。IATA CO2 Connect 统一了按每位乘客计算的排放量计算方法。Wenrix 航班中断和重新安排航班的数据。如果你曾见过某家航空公司单独无法提供的自助转机行程,那就意味着你已经使用过虚拟联运服务,而其背后的中转逻辑是旅游行业中最复杂的数据工程之一。

6. 旅游API和连接枢纽:纽带

每一层都必须与下层的所有层进行交互,而这种集成工作本身就构成了一类独立的产品类别。连接枢纽和广泛的旅行API正是为了将众多杂乱的连接整合为一个整体而存在的。 其价值主张虽然平淡无奇,却意义重大:编写一次集成,即可对接数百家供应商。这一层级之所以持续吸引投资,是因为随着技术栈不断新增NDC承运商、床位库和附加服务数据源,集成债务也在持续累积。

地图上的标记迪达 以及霍珀 作为连接与API领域的参与者,凭借霍珀 特别是,该公司将其在消费者价格预测方面的技术优势转化为一个B2B引擎(Hopper Technology Solutions),供其他旅游品牌嵌入使用。这一层面的知名企业数量虽不如上层的聚合平台层多,但在结构上却至关重要:它就像是连接组织,让一个小团队能够表现得仿佛与整个行业深度整合一般。 既然所有竞争对手都已建立了相同的供应商连接,为何还要重新构建?

7. 元搜索和合作伙伴 API:比较引擎

元搜索是预订前的比价平台。这些搜索引擎会扫描数十家甚至数百家供应商,并将旅客引导至价格最优惠的供应商。仅Skyscanner一家,在单次查询中就会扫描1,200多家旅游服务商(Skyscanner(2026年)。元搜索平台通常并不直接销售机票;它提供价格比较服务,并将用户点击引导至其他平台,因此其全部价值都取决于能否提供最新、全面且准确的价格数据。

关键人物包括Skyscanner,Kiwi.com (及其 Tequila API),Trip.com,Traveloka,MakeMyTrip,Google 航班,以及奖项搜索专家Point.me. 这一层在整个架构中面临着最大的生存压力:Skift 在 2026 年 2 月的一篇分析报告中专门探讨了,随着旅客开始通过聊天机器人预订行程,人工智能助手是否会完全取代元搜索(Skift(2026年)。无论前端是比较网格还是对话,其底层的数据需求都是一样的,而且这种需求只会越来越大。

关于团队如何大规模收集竞争对手的价格信息,请参阅我们的2026年零售数据反机器人操作指南.

8. 消费者平台:需求面

这是旅行者实际能认知到的层级,也是总预订额体现的层面。2024年,在线旅行社的总预订额约为7940亿美元,该细分市场创造了约940亿美元的收入,预计到2026年将达到约1070亿美元(Skift Research(2025年)。这些品牌拥有雄厚的营销预算、完善的忠诚度计划以及大量的应用安装量。

这份清单很长,而且大家都很熟悉:Expedia,预订 诸如……等品牌Priceline 以及Agoda,皮划艇,Hotels.com,爱彼迎,VRBO,Trivago,猫途鹰,momondo,以及来自……的雄厚专家阵容Skiplagged替代航空公司. 这些平台彼此都在密切关注对方。价格一致性、库存情况和排名都取决于对竞争对手展示内容的掌握,这也正是这一层成为整个行业中实时网络数据消耗量最大的领域之一的原因。

9. 旅行体验类应用:这一领域仍在建设之中

机票和酒店预订已基本实现数字化;但抵达目的地后的活动却尚未实现数字化。 2025年,体验行业规模达到约2710亿美元,预计到2029年将达到约3420亿美元,但2025年该行业的在线预订占比仅为总预订额的33%,而整个旅游行业的这一比例则为64%(Arival 和 Phocuswright(2025年)。目前仍有三分之二的资金通过线下渠道结算。这一差距正是机遇所在。

Experiences are still going digital SHARE OF EXPERIENCES BOOKED ONLINE All travel: 64% 17% 33% 42% 2019 2025 2029 (forecast)

来源:Arival 和 Phocuswright,《全球市场规模预测,2025-2026年》。

追逐它的球员们充满活力:GetYourGuide,Viator,Klook,以及Headout 在旅游和活动方面;TripIt,《漫游日记》,以及Stippl 关于行程规划;以及《Atlas Obscura》 针对那些小众的、不寻常的活动。渗透率差距是整个拆解分析中最清晰的“在此布局”信号:在2026年,一个规模达3420亿美元、但仅有三分之一在线化的市场实属罕见。

10. 结账与身份验证:支付、交叉销售和欺诈防范

一旦旅客做出决定,交易就必须完成,而旅游支付却格外困难。 高昂的票价、跨境货币结算、退款风险以及猖獗的欺诈行为在结账环节交织在一起。这也是航空公司和卖家获取那1570亿美元附加收入的关键环节,因为增值销售(座位、行李、保险、升舱)正是在这个销售点发生的(IdeaWorksCompany 和 CarTrawler, 2025)。

该地图的结账图层包括Plusgrade (通过升级和追加销售实现变现),Cell Point Digital (支付协调),霍珀技术解决方案 (如“价格锁定”和“无理由取消”等金融科技产品),以及分期付款服务提供商,例如Flex Pay 以及Movmo. 根据我们的经验,任何开发过旅游结账系统的人都清楚这一点:支付和反欺诈系统往往比其所依托的预订流程需要投入更多的工程开发工作,因为一笔定价错误或欺诈性的高额预订,就足以抵消数十笔正常预订带来的利润。

11. 旅行eSIM:旅途中的网络连接

这一最新领域在五年前几乎还不存在。旅行eSIM应用程序让旅行者抵达新国家后,无需更换实体SIM卡即可使用数据服务,且该市场增长迅猛。 尽管分析师们对具体市场规模存在分歧,但多项预测显示,到2030年代初期,旅游eSIM市场的年复合增长率(CAGR)将超过60%(DataM Intelligence(2025年)。即使数据存在分歧,大家对方向的看法却是一致的。

各分类的领跑者是Airalo (最大的),Holafly,Saily,aloSIM,以及Roamless. 使eSIM成为数据堆栈故事而非单纯的电信故事的关键在于其后端:实时覆盖范围、定价和资费套餐的可用性因国家和运营商而异,因此这些应用的成败取决于其能否获取关于非自有网络的准确、基于地理位置的数据。 这恰如其分地构成了数据堆栈的顶层,因为它展现了与下方每一层相同的模式:产品本身是一款应用,但其护城河在于为其提供数据支持的数据源。

旅行数据架构一览

# Layer What it does Defining players
1 Global Distribution Systems Legacy booking switchboard for air, hotel, car Amadeus, Sabre, Travelport, TBO
2 NDC / Airline Retail Aggregates airlines' modern, GDS-exclusive offers Duffel, Verteil, Mystifly, AirGateway, Kyte
3 Flight Data Schedules, status, positions, fare signals OAG, Cirium, FlightAware, Aviationstack
4 Hotel & Inventory Bedbank wholesale of rooms to sellers Hotelbeds (HBX), WebBeds, RateHawk, Expedia Rapid
5 Specialty Data Ancillaries, disruption, CO2, interlining TripStack, FlightRadar24 API, IATA CO2 Connect
6 Connectivity Hubs One integration to reach many suppliers Dida, Hopper
7 Metasearch Compares suppliers, routes the click Skyscanner, Kiwi.com, Google Flights, Trivago
8 Consumer Platforms The booking brands travelers know Expedia, Booking, Airbnb, Kayak, Agoda
9 Experience Apps Tours, activities, and trip planning GetYourGuide, Viator, Klook, TripIt
10 Checkout & Identity Payments, upsell, and fraud at point of sale Plusgrade, Cell Point Digital, Flex Pay
11 Travel eSIM In-trip connectivity for travelers Airalo, Holafly, Saily, Roamless

我们是如何绘制该技术栈图的

本拆解报告基于2026年第一季度的旅游数据行业市场图谱,并对每一项统计数据均与一手数据和行业数据源进行了交叉核对。 这11个层级按照从技术栈基础(早于互联网时代的GDS骨干网络)到最新面向消费者的层级(旅游eSIM)的顺序排列,追踪单笔预订从供应端到旅客手中的全流程。

这份清单的编制遵循了几条基本原则。每个层级必须代表技术栈中一个独立的岗位,而非营销类别——这就是为什么“支付”和“连接”尽管不如“预订”那么引人注目,却仍拥有各自的条目。所有提及的公司均来自来源市场图谱,所有数据均注明了来源发布方及检索日期,详见下文来源列表。 当市场规模估算存在不确定性,或数据源自可信度较低的聚合平台时(尤其是eSIM市场规模及GDS市场份额的具体分配情况),表述均采用趋势性描述,而非将单一数字作为事实断言。

支撑所有11个的数据层

这就是将上述所有层面联系起来的纽带。旅游数据既具有价值,又具有时效性,各国定价各异,且其安全防护力度之严密,几乎在整个网络上都无出其右。 2024年,旅游业成为网络上遭受机器人攻击最严重的单一行业:旅游网站总流量中,恶意机器人占比约48%,人类用户占比约47%,良性机器人占比5%;与此同时,自动化流量首次超过了网络总流量的51%(Imperva, 2025)。

Travel is the web's most-targeted industry SHARE OF TRAVEL-SITE TRAFFIC, 2024 48% bad-bot traffic Bad bots: 48% Human: 47% Good bots: 5%

来源:《Imperva 2025年恶意机器人报告》,2025年。

这一统计数据道出了问题的全貌。在我们与负责收集公开价格数据的旅游和电商团队合作的过程中,几乎在每个层级都会遇到同样的障碍:所需数据具有地域特异性,而提供这些数据的网站却不希望你获取这些信息。 元搜索平台需要最新的竞争对手价格。与此同时,在线旅行社(OTA)会严格监控竞争对手之间的价格一致性。酒店预订平台和电子SIM卡应用会根据客源市场提供不同的房价。这一切都取决于能否从目标国家收集到准确且具有地域特性的公开网络数据,而旅游网站则会强烈抵制那些看起来不像真实本地消费者的流量。

这就是官方API所留下的空白。GDS数据源不会告诉你竞争对手向巴西消费者收取多少费用;床位库的房价也不会透露竞争对手在德国网站上的公开价格。需要获取这些信息的团队只能借助专门为此构建的基础设施。Massive例如,这是一个集设备访问网络与渲染堆栈于一体的系统,能够从任何地点的任何公开来源返回纯净的 HTML 或 Markdown 代码。它利用遍布 195 多个国家的真实消费级设备,因此无论是在圣保罗还是柏林进行的比价查询,都会被识别为真实的本地访问,而非被屏蔽的数据中心流量。重点并不在于某一家供应商。 关键在于,实时且地理位置精准的网络数据已悄然成为技术栈的第十二层,填补了其他十一层留下的空白。

关于请求来源为何对获取准确、基于地理位置的数据至关重要,更多内容如下:住宅代理与数据中心代理.

结论:十一层,一个数据问题

旅游数据架构看似由十一项独立业务组成,但从上到下其实是相辅相成的。 从20世纪70年代的全球分销系统(GDS)到2026年的eSIM应用,每一层本质上都是一个披着不同外衣的数据问题。在每一层脱颖而出的企业,正是那些对供应和价格拥有最清晰、最新鲜、地理位置最精准视图的公司。

随着2026年的到来,有三件事值得关注:NDC进一步蚕食GDS的市场份额、AI助手对元搜索层构成压力,以及旅行体验终于实现数字化。 如果你正在开发旅游相关产品,请选择数据缺口最大的领域(体验和eSIM位居榜首),并在完善顶层界面之前,先解决其底层的实时数据问题。

如果您打算在此层基础上进行开发,请先参考我们的指南:为人工智能代理提供实时网络访问权限.

来源

常见问题解答

什么是旅行数据堆栈?+

旅游数据堆栈是指将旅游产品从供应方传递给旅客的一系列互联系统,包括分销系统、航空公司零售和NDC API、航班及酒店数据源、元搜索、消费者预订平台、支付系统以及互联互通。2025年,旅游业为全球GDP贡献了11.6万亿美元(WTTC(2026年),而这个栈在所有这些组件的底层运行。

GDS和NDC有什么区别?+

GDS(Amadeus、Sabre、Travelport)是面向旅游销售商聚合内容的传统“总机”,据估计,这三大平台处理了95%以上的GDS预订。 NDC(新分销能力)是航空公司采用的一种较新标准,用于直接销售内容更丰富、通常仅在GDS上独家提供的优惠。截至2024年,NDC交易量同比增长约165%(Accelya, 2024)。

为什么旅游业是网上被爬取最多的行业?+

旅游价格价值高、波动频繁,且因国家而异,因此竞争对手、转售商和诈骗分子都觊觎这些数据。2024年,旅游网站流量中约有48%来自恶意机器人,这一比例在各行业中居首(Imperva(2025年)。这种压力影响着架构中每一层的数据防护和采集方式。

2026年,哪个旅游数据层将带来最大的机遇?+

旅游体验尤为突出。该行业在2025年的规模达到约2710亿美元,预计到2029年将达到3420亿美元,但在线预订占比仅为33%,而旅游业整体的在线预订占比则为64%(Arival 和 Phocuswright(2025年)。像这样规模庞大、增长迅速且仍主要以线下形式存在的市场实属罕见。