短视频使用与认知功能及心理健康：基于 71 项研究的系统综述与元分析解读

一、短视频时代与大脑负担的出现

近十年内，短视频从一种边缘功能迅速演变为全球主流的信息与娱乐载体。以 TikTok、抖音、YouTube Shorts、Instagram Reels 为代表的平台，将视频长度压缩到数秒到数十秒，通过无限下滑的设计和高度个性化的推荐算法，让用户在极短时间内接触到大量多样而强刺激的内容。对许多年轻人而言，短视频已经成为获取新闻、社交线索、流行文化乃至学习资源的核心渠道，而不再只是“打发时间”的附属品。

这种使用习惯的改变带来了广泛的社会讨论。一方面，短视频被视为降低门槛、释放创作与表达的工具，为边缘群体和普通个体提供了前所未有的发声机会，也推动了教育、科普和公益内容的传播。另一方面，关于“注意力被碎片化”“越来越难专心”的主观感受在不同年龄层迅速扩散，与焦虑、睡眠不足、拖延和情绪波动相关的个案报道也明显增多。短视频是否正在消耗人类的大脑资源与心理韧性，开始成为新闻、评论和家庭对话中的高频议题。

心理学与认知科学领域并未忽视这一变化。过去十余年，大量研究已经关注社交媒体使用与抑郁、焦虑、自尊、睡眠质量之间的关系，但这些研究多以图文或长视频平台为对象，对专门针对短视频这种高节奏、强推荐、重算法的媒介形态的系统证据仍然有限。与此同时，关于注意力广度、抑制控制、前瞻记忆等具体认知功能是否受到影响，既有研究给出的结果分散且方向不完全一致：部分实验报告了显著的负面效应，部分研究则发现关联较弱甚至不显著，难以支撑统一结论。

在公共舆论层面，“短视频正在毁掉整整一代人”与“短视频不过是新的电视，不必夸大其害”两种极端叙事长期并存。前者往往根据个案、极端案例或道德直觉放大风险，后者则强调数字媒体使用的普遍性与适应性，提醒避免技术恐慌。然而，在缺乏高质量汇总证据的情况下，关于短视频影响的讨论很容易滑向情绪化和标签化，对政策制定、家庭决策和个体自我管理提供的参考价值有限。

在这一背景下，《Feeds, Feelings and Focus》这篇系统综述与元分析试图填补关键空白。作者团队不再停留在单一实验或个别平台的观察，而是系统梳理了截至 2024 年的实证研究，将与短视频使用相关的认知测验结果与心理健康指标进行整合分析。通过对 70 余项量化研究、近十万名参与者数据的综合，他们希望在高度情绪化的公共讨论之外，提供一幅更为冷静、可量化的图景：短视频使用与注意力、抑制控制等核心认知功能，与焦虑、压力、抑郁、睡眠与主观幸福感等心理健康指标之间，在真实世界中究竟呈现出怎样的平均关联模式，其强度处于何种水平，又在多大程度上受到年龄、平台类型与使用方式等因素的调节。

这一整合性工作，将短视频从道德判断和直觉经验中抽离出来，纳入可检验的科学框架之中，也为后续更细致的机制研究与干预设计建立了出发点。

二、研究综述的整体设计与数据来源

本节介绍论文的整体方法，包括研究框架、文献纳入标准、信息来源、筛选流程以及后续元分析所依托的数据结构。

2.1 研究设计与规范框架

作者将本研究定位为系统综述与元分析，遵循当代循证研究的主流规范：

参考 Cochrane 系统综述手册设计整体流程；
按 PRISMA 2020 报告规范呈现检索、筛选与纳入过程；
在元分析部分采用心理学领域的 Meta-Analytic Reporting Standards。

研究方案在 PROSPERO 平台完成预注册，明确了检索策略、纳入/排除标准、计划中的子组分析与调节分析。正式实施过程中，只有少量调整：例如原计划按“临床 vs 非临床样本”比较，但由于符合条件的临床研究极少，该子分析被取消；同时根据实际提取情况，增加了“短视频使用测量方式”这一调节变量。

为提高透明度，作者声明未使用生成式工具参与研究设计、数据提取或写作，并将完整的编码表和分析脚本上传至开放科学平台，供后续复核与再分析。

2.2 纳入与排除标准

纳入标准围绕“短视频使用”与“认知/心理健康指标的量化关系”这一核心展开，主要包括以下几方面：

（1）研究类型与人群

仅纳入实证、量化研究：横断面相关研究、组间比较研究、实验/准实验、纵向随访研究均可；
排除纯质性研究、综述、评论与理论性论文；
被试人群不限年龄与背景，青少年、大学生、一般成年人均可纳入；是否临床样本不作为硬性限制，但临床干预研究整体被排除。

（2）自变量：短视频使用

短视频被界定为时长从数秒到数分钟的在线视频内容；
平台包括以短视频为核心的应用（如 TikTok、抖音、Kuaishou、Bilibili 等）以及综合社交平台上的短视频功能（如 Instagram Reels、Facebook Reels、Snapchat Spotlight 等）；
研究需对短视频使用有明确、可量化的测量，如：
- 成瘾或问题性使用量表；
- 使用时长（每天/每周）；
- 使用频率（打开次数、使用天数等）；
- 使用强度或依附感（心理依赖、情感投入）；
- 使用状态/组别（使用 vs 不使用，高使用 vs 低使用）。
对短视频与其他社交媒体功能不加区分的笼统“社交媒体使用”测量不被纳入。

（3）结局变量：认知与心理健康指标

认知指标包括：注意力、抑制控制、工作记忆、长期记忆、语言能力、推理能力、执行功能等，可来源于客观任务或标准化量表；
心理健康指标按照 ICD-11 和常用量表分类，包括：抑郁、焦虑、主观压力、睡眠质量、孤独感、主观幸福感、自尊、身体意象等；
研究需报告短视频使用与上述指标之间的定量关系（相关系数、组间差异等），便于换算为统一效应量。

（4）设计要求

研究必须在统计上呈现“短视频使用”与“认知/心理健康指标”的关联或差异；
若样本仅包含单一使用水平且未与任何结果变量建立统计关系，则无法纳入元分析；
虽然作者在技术上使用“outcome（结局变量）”一词，但明确强调：多数研究为横断面设计，因此这些变量更准确的表述是“相关指标（correlates）”。

2.3 信息来源与检索范围

信息来源覆盖主流文献数据库与灰色文献渠道：

检索时间范围截至 2024 年 10 月 28 日，不设起始年份限制；
数据库包括：
- APA PsycInfo（心理与行为科学）；
- PubMed（医学与生命科学）；
- Scopus（跨学科综合数据库）；
- Web of Science（跨学科引文数据库）。

为降低发表偏倚，研究还系统检索：

ProQuest Conference Papers Index（会议论文）；
ProQuest Dissertations and Theses（学位论文）。

语言上不设限制，涉及非英文文献时，通过翻译工具进行初步筛选与人工核查。在实际纳入的研究中，包含少量中文研究。

在数据库检索之外，作者使用两种补充策略：

前向追踪：利用 Google Scholar 的“被引文献”功能，寻找引用已纳入研究的新成果；
反向追踪：检查已纳入论文的参考文献列表，寻找早期相关研究。

此外，还对若干与媒体与技术心理学相关的期刊进行手工检索，以确保重要期刊论文不被漏检。

2.4 检索策略与筛选流程

检索策略通过多轮试搜逐步形成。研究团队先在 Scopus 上依据先前综述与关键论文提炼短视频与健康相关关键词，对前数百条结果进行人工检查，补充遗漏词汇，最终形成较为完备的组合：

一组词聚焦短视频形式与平台（如 “short-form video*”, “short video*”, TikTok, Douyin, Bilibili, “Instagram reel*”, “Facebook reel*”, Snapchat 等）；
另一组词聚焦认知与心理健康（如 cognition, attention, memory, “executive function*”, health, mood, stress, anxiety, depression, sleep, well-being, “quality of life”, “mental health” 等）。

检索结果汇总后导入 Covidence 平台进行管理与筛选：

由系统与人工共同去重；
第一阶段进行标题与摘要筛选：每篇文献由两名作者独立判断是否“可能符合”；
第二阶段进行全文筛选：同样由两名作者独立评估，按照既定纳入标准做出“纳入/排除”决定。

为保证一致性与可靠性：

一名核心作者参与所有文献的筛选；
其他作者各自分担约 17% 的文献，用以形成交叉复核；
通过 Cohen’s κ 统计一致性：标题/摘要阶段 κ 约为 0.87，全文阶段约为 0.94，均属于很高的一致性水平；
对判断不一致的条目，由全体作者讨论后达成最终决定。

对于关键信息缺失的研究，研究团队通过邮件联系原作者索取必要数据，其中部分作者提供了补充数据，使得更多研究能够进入元分析。

2.5 数据提取与质量评估

筛选完成后，作者对纳入研究进行系统的数据提取与方法学质量评估。

（1）数据提取

研究团队先选取 5 篇文献进行试提取，以校准需要记录的变量，随后形成正式提取表，主要包括：

研究基本信息：作者、年份、国家或地区、发表渠道、研究设计类型等；
样本特征：样本量、年龄范围与平均年龄、性别比例、招募方式（如中学生、大学生、一般人群）；
短视频使用测量：
- 使用何种量表或自编项目；
- 指标类别（时长、频率、成瘾、强度、使用状态）；
- 是否针对特定平台（如 TikTok）或泛指短视频；
结局变量测量：
- 所属维度（认知、心理、身体）；
- 对应的具体量表或任务（如 Stroop、Go/No-Go、各类抑郁/焦虑量表等）；
统计结果：
- 原始相关系数 r；
- 或组间均值及标准差、t 值、F 值等，可换算为 r 的信息。

数据提取由一名作者完成，其他作者对约 17% 的文献进行抽查，未发现系统性偏差。

（2）方法学质量评估

研究质量由两名作者使用 Mixed Methods Appraisal Tool（MMAT 2018）独立评估，涵盖以下方面：

抽样策略是否与研究目的相匹配；
样本是否具有代表性（或明确界定样本范围）；
测量工具是否经过验证或具有合理信度；
非应答偏倚的风险（如缺失数据处理、参与率）；
统计分析方法是否适当、与研究问题相符。

每项以“是/否/不清楚”打分，进而形成综合质量评分（0–5 分）。一般而言，大部分研究在测量工具与统计方法上表现良好，但在抽样代表性方面存在明显局限——大量研究基于单一学校或大学生便利样本。

2.6 统计整合策略概述

在完成数据提取与质量评估后，作者使用元分析技术对各研究结果进行整合：

统一采用相关系数 r 作为效应量：
- 对于相关研究，直接使用报告的 r 值；
- 对于组间比较研究，将标准化均数差转换为 r；
由于不同研究在样本、文化背景与测量工具方面存在显著差异，采用随机效应模型估计总体效应；
使用 Q 统计量与 I² 指标评估研究间异质性，在异质性较高的情况下，通过亚组分析与元回归探讨潜在来源（例如年龄组别、平台类型、短视频测量方式、是否控制协变量等）；
采用漏斗图、Egger 回归及 trim-and-fill 方法检查发表偏倚，并报告在偏倚调整前后的效应量差异；
在敏感性分析中，分别检验：
- 剔除质量较低研究后的总体效应是否保持稳定；
- 仅使用相关研究或仅使用组间研究时，效应量是否显著变化。

通过上述设计与数据来源，论文为后续关于“短视频使用与认知功能、心理健康的量化关系”提供了一个结构清晰、方法透明的证据基础。

三、短视频使用的多种衡量方式

在这篇综述中，“短视频使用”并不是一个单一、统一的指标，而是由多种不同量表和问题构成的“家族”。理解这些测量方式的差异，是正确解读后面所有统计结果的前提。

整体来看，作者将各研究中的短视频使用测量，归纳为四类核心指标：成瘾 / 问题性使用、使用时长、使用频率、使用强度 / 依附，外加一小类“是否使用/组别划分”的指标。不同指标在纳入研究中的占比相差很大，也反映出研究传统和关注重点的差异。

3.1 成瘾与问题性使用：最常见、效应也往往最大的一类

在所有纳入研究中，使用最频繁的是各类**“短视频成瘾 / 问题性使用”**量表，约占全部研究的一半以上。

这类量表通常包含若干条目，围绕以下几个方面提问：

是否经常觉得“停不下来”“一刷就过很久”；
是否会因为刷短视频而推迟重要任务、学习或工作；
不刷的时候是否感到明显烦躁、空虚或“少了点什么”；
日常生活、人际关系、睡眠是否因为刷短视频受到影响。

从测量目的来看，这些量表试图捕捉的不是“用多少”，而是使用带来的功能损害和失控感。许多工具并非完全从零开发，而是改编自已有的“社交媒体成瘾”“网络成瘾”“手机成瘾”量表，将其中的“社交媒体/网络/手机”改写成具体短视频平台或“短视频”。这使得量表在结构上延续了行为成瘾研究的一般框架：耐受（越用越停不下）、戒断（停用时不适）、冲动与控制失败、日常功能受损等。

从后面的结果可以看到，与其他几类指标相比，“成瘾 / 问题性使用”与认知和心理健康之间的负相关通常更大。这并不意外，因为这一指标本身就夹带了“已经出现问题”的信息，与“每天刷多久”这种纯行为量明显不同。

3.2 使用时长：最直观、但信息相对粗糙的指标

第二类常见指标是使用时长（duration），约占研究样本的四分之一到三分之一。

这类测量通常采用一两道自陈题，例如：

“平均每天使用短视频的时间（小时/分钟）”；
“过去一周/过去一个月内，使用短视频的大致时长”。

时长指标有几个特点：

直观易懂 研究参与者通常容易回答，对研究者来说也便于与其他媒体使用（如电视、游戏）对比。
容易产生回忆偏差 自报时长依赖被试的主观估计，很多人对自己“到底刷了多久”并不敏感，容易低估或高估。
不区分内容与情境 纯时长无法反映刷的是学习内容、娱乐内容还是高度情绪化内容，也无法区分是在白天休息间隙还是在凌晨入睡前使用。

综述的结果显示，使用时长与认知、心理健康之间的相关一般弱于“成瘾 / 问题性使用”。在解读时应意识到：“刷多长时间”并不能天然等同于“有多大问题”，但在群体层面仍然提供了一个粗略的暴露强度指示。

3.3 使用频率：以“打开次数”和“使用天数”为代表

第三类指标是使用频率（frequency），在纳入研究中数量略少。

典型问题包括：

“平均每天打开短视频应用的次数”；
“一周有多少天会刷短视频”；
“是否每天都使用短视频（是/否）”。

与时长相比，频率指标侧重于使用行为的“碎片化程度”：

有人每天集中刷一两个时段，总时长较长，但打开次数不算多；
也有人每次只刷几分钟，却一天打开十几次。

在理论上，高频率的“少量多次”使用更接近“习惯化”甚至“条件反射式使用”的图景，不过由于相关研究整体较少，综述对这一类指标的统计汇总相对有限。作者在讨论中提示，未来研究有必要更系统地将“时长”和“频率”区分开来，因为它们对应着不同的行为模式。

3.4 使用强度与心理依附：介于“行为量”和“成瘾感”之间

第四类测量可归入使用强度 / 依附（intensity / attachment）。这类指标往往不单纯问“多少时间”或“多少次”，而是关注个体对短视频的情感投入和心理依赖，例如：

“短视频在日常生活中对自己有多重要”；
“离开短视频是否会感到无聊或失落”；
“使用短视频是否是主要的放松方式或社交方式”。

与“成瘾 / 问题性使用”相比，这一类指标强调的是主观重要性与心理依附，不必然要求出现明显的功能损害，比如学业下降、社交冲突等。因此，可以把它视作处在“普通使用”与“明显问题使用”之间的一个中间层。

由于各研究使用的条目和量表差异较大，这一类指标在统计上被整体归入“强度/依附”范畴，而不再细分具体量表。作者在讨论中指出，这一领域尚缺乏统一、经过充分验证的短视频专用强度量表，是今后测量工作需要补足的一块。

3.5 使用状态与组别划分：粗颗粒度的二元指标

少数研究采用较为粗略的组别划分方式，例如：

将被试分为“短视频用户 vs 非用户”；
或按使用频率/时长划分为“高使用 vs 低使用”两组，仅比较组间在某些认知或心理指标上的差异。

这类设计在早期探索性研究中较为常见，优点是统计处理简单、结果直观；缺点在于信息损失较大，难以刻画剂量–反应关系，也不利于在元分析中与连续型指标统一处理。因此，在本综述中，这部分数据主要在个别子分析和叙述性总结中出现。

3.6 测量方式差异对后续结果解读的重要性

综述在方法部分即强调：短视频使用的测量方式本身，会显著影响与认知和心理健康之间的关联强度。这一点在后续统计结果中得到了印证：

使用“成瘾 / 问题性使用”量表时，短视频与注意力、抑制控制、焦虑和压力之间的负相关往往达到中等水平；
使用单纯“时长”或“频率”指标时，效应通常更弱，部分结果接近零；
强度/依附指标的效应介于两者之间，但由于研究数量较少，结论相对初步。

因此，当看到“短视频使用与某某指标呈现 r = −0.3”或“相关不显著”时，需要首先追问：这里的“使用”指的究竟是哪一种测量方式。这一点不仅关乎统计意义，也直接影响后续对风险群体的识别与干预策略的设计：若风险主要集中在“问题性使用”群体，则针对性支持和干预的重点就与单纯“缩短所有人使用时长”明显不同。

四、认知功能相关结果的总体图景

本节概括短视频使用与认知功能之间的总体统计关系，重点包括：纳入研究的规模与类型、综合效应量、不同认知维度的差异，以及异质性与偏倚检验结果。

4.1 研究数量与认知任务概况

在所有纳入文献中，有 14 项研究报告了短视频使用与认知表现之间的量化关系，并满足元分析所需的数据条件。这些研究的样本类型主要包括：

中学生和高中生；
大学生与青年成年人；
少量一般社区样本（如在线招募的成年人）。

认知测量工具具有显著多样性，大致可归入以下几类：

注意力任务：如持续性注意任务、视觉搜索任务、注意网络测验等；
抑制控制任务：如 Go/No-Go、Stroop、Flanker 等经典抑制或干扰任务；
记忆与工作记忆任务：包括数字广度、n-back、词表记忆等；
语言能力测验：如词汇量任务、阅读理解等；
推理与高阶执行功能任务：如矩阵推理、复杂问题解决等。

部分研究还结合了行为表现与神经电生理指标，例如在注意任务中记录 P300 波幅等，用以反映注意资源分配和加工效率的神经层面变化。整体而言，这些研究覆盖了从基础注意加工到较高层次认知控制的多个维度，为综合分析提供了多侧面的证据基础。

4.2 综合效应量：中等程度的负相关

对这 14 项研究的整合显示，短视频使用与总体认知表现之间存在一个显著的中等负相关：

综合效应量 r = −0.34，95% 置信区间 [−0.42, −0.26]，p < .001。

这一结果表明，在纳入研究的平均水平上，短视频使用程度越高，被试在认知测验中的表现整体越差，差异幅度达到心理学中常用标准中的“中等效应”区间。

为了检验发表偏倚的影响，作者绘制了漏斗图并进行了 Egger 回归与 trim-and-fill 分析：

漏斗图整体相对对称；
Egger 回归显示偏倚指标不显著；
trim-and-fill 方法仅补入了 1 个低精度、负向效应的假想研究，偏倚调整后的效应量为 r 调整 = −0.35，95% 置信区间 [−0.42, −0.27]。

与原始值（−0.34）相比，调整后效应仅略微变得更负，解释层面并无实质变化。这说明，在目前的数据基础上，发表偏倚对认知总体效应量的影响可以视为有限。

4.3 高度异质性与调节分析

尽管综合效应量较为稳健，不同研究之间的差异仍然非常明显：

异质性检验结果为 Q(13) = 304.11, p < .001，I² = 95.73%，属于典型的“高度异质”。

高 I² 值意味着各研究估计的效应量在真实层面差异很大，而不仅仅是抽样误差所致。为探讨差异来源，作者进行了多项调节分析，并发现：

**认知域（cognitive domain）**是显著的调节变量。

以认知域为分组标准，短视频使用与认知的关系呈现出清晰的分化模式：

注意力（attention）：中等负相关；
抑制控制（inhibitory control）：中等负相关；
语言、记忆、工作记忆：弱负相关；
推理（reasoning）：平均效应接近零，即未观察到稳定的关联。

换言之，短视频使用与认知的关系并非“一刀切”的整体下降，而是对基础注意资源与抑制控制表现出更显著的联系，对词汇、记忆、工作记忆等领域则体现为较小的负偏移，对高阶推理和问题解决在现有数据下尚不能确认存在系统差异。

除认知域外，作者还尝试从以下角度考察差异来源：

研究设计（横断面 vs 组间比较/实验）；
短视频使用测量方式（成瘾/问题使用 vs 时长/频率等）；
是否控制总体社交媒体使用等协变量。

总体而言，在认知部分，这些因素并未产生像“认知域”那样稳定、显著的调节效果，但在部分子分析中，使用“成瘾/问题性使用”量表的研究，其负相关效应往往更大，而仅以时长或频率衡量使用的研究，效应则相对较弱。

4.4 与测量方式相关的差异

结合第三节中对短视频使用指标的分类，认知结果与测量方式之间呈现出相对一致的趋势：

使用**“成瘾 / 问题性使用”**量表时，短视频使用与整体认知表现、尤其是注意力和抑制控制之间的负相关，多数达到中等水平；
仅使用**“每日时长”或“使用频率”**指标时，许多研究报告的效应量较小，部分结果甚至不显著；
使用心理依附或使用强度指标的研究数量有限，效应大小介于上述两者之间，结论尚不牢固。

这种差别提示，“多少时间”与“使用是否已经变成问题”是性质不同的测量：前者偏向描述接触程度，后者更多反映失控感和生活功能受损。综述在解读中强调，认知负效应主要集中在问题性使用群体，这在后文讨论心理健康结果时也会再次出现。

4.5 对“中等负相关”的理解

将 r ≈ −0.34 这一综合效应具体化，有助于避免对结果的过度放大或严重低估。

从群体层面看，这一效应在心理学与教育研究中被视为具有实际意义的差异：在数万人的综合样本中，短视频使用水平较高的群体，其认知测验得分整体偏低，而这一偏低并非偶然波动。
从个体层面看，这一效应仍然属于“概率性风险”：它并不意味着“所有高使用者都会出现显著认知下降”，而是表示在统计意义上，高使用与认知表现不佳同时出现的概率更高。

进一步结合认知域的调节结果，可以得到一个较为清晰的概括：

当前证据更集中地指向注意力维持和抑制干扰能力的削弱，而对高阶推理与复杂问题解决的影响尚不明朗；
这一图景既支持了公共语境中关于“注意力被牵扯得更碎”的主观体验，也提醒在讨论时应避免泛化为“整体智力下降”或“全面认知退化”。

总的来看，本节呈现的，是在现有研究基础上可以相对确定的一点：短视频使用与认知功能之间的关系，不是无关，也不是灾难性衰退，而是在若干关键基础能力上形成了稳定的中等负相关，并且这一负向关联在问题性使用者身上更为突出。

五、注意力与抑制控制的关键发现

在认知各子领域中，注意力与抑制控制是本研究样本数量最多、结果最为一致的两个部分，也是与短视频使用关联最强的认知环节。

5.1 效应量：两个“重灾区”

在 98,299 名被试、71 项研究的总体框架下，作者将所有涉及认知的研究拆分到不同子域，并分别计算效应量。结果显示：

整体认知功能与短视频使用的平均相关为 r = −0.34；
其中：
- 注意力（attention）：相关系数约 r = −0.38；
- 抑制控制（inhibitory control）：相关系数约 r = −0.41；
- 语言、记忆、工作记忆仅呈弱负相关，推理能力总体上则“不显著”。

也就是说，在所有被考察的认知环节里，受短视频使用影响最明显的，是“把注意力收拢并维持下去”的能力，以及“看到诱惑时按住手不去做”的能力。

这些数值仍然属于相关而非因果，但从效应大小来看，已经超出“偶然波动”的范围，在群体水平上具有实际意义。

5.2 行为层面的证据：从持续注意到自控失败

具体到单篇研究，注意力与抑制控制问题主要通过以下任务或量表体现：

持续性注意任务：要求受试者在一段时间内对少量目标刺激保持警觉，重视正确率与反应时稳定性；
视觉 oddball / 注意网络任务：通过稀有刺激与常规刺激的区分测试对“罕见、重要信号”的捕捉能力；
Stroop、Flanker、Go/No-Go 等抑制任务：考察个体抑制自动反应、抵抗干扰的能力；
以及各种自我报告的“注意困难”“冲动控制困难”等量表条目。

在多个研究中，高频或问题性短视频使用者在这些任务上的表现，普遍比低使用者差。例如：

以青少年样本为主的研究发现，短视频使用越多，在持续注意任务中的漏检率越高，对干扰刺激的反应时间越长或波动越大；
某些研究对青少年进行分组比较（非用户、适度用户、成瘾用户），结果显示“成瘾组”在注意任务中的表现显著落后于“适度组”和“非用户组”。

在抑制控制方面，表现形式包括：

Go/No-Go 任务中误按率升高，说明在“应该停下的时刻”更容易冲动响应；
Stroop 或 Flanker 任务中，面对不一致刺激时反应更慢、错误更多，表示抑制干扰的成本变高；
现实行为层面，与拖延、学习任务中难以“按计划停下玩手机”等指标显著相关。

总的来说，这些行为证据共同描绘出一幅图：重度短视频用户并非什么都“变笨”，而是在“守住当前任务、不被新刺激拽走”这类情境中更吃力。

5.3 神经生理证据：P300 与前额叶控制网络

在少数研究中，作者不仅考察行为表现，也记录了脑电或脑成像指标，用以观察与注意控制、执行功能相关的神经活动。

一个具有代表性的例子是 Walla 和 Zheng（2024）的脑电研究：

研究采用经典的视觉 oddball 任务，要求被试对少见刺激做出反应；
与普通短视频用户相比，重度短视频用户在面对罕见和重复刺激时，P300 成分的振幅明显下降；
P300 通常被视为“资源分配”和“注意更新”的电生理标记，振幅减小往往意味着对目标刺激的注意分配减少或加工效率下降。

同时，其他研究基于功能与结构成像指出：

高强度社交媒体/短视频使用者在前额叶皮层和纹状体奖励回路中存在结构或功能差异；
这些区域本身就与执行控制、冲动抑制和奖赏处理密切相关；
问题性社交媒体使用还与多巴胺奖赏系统的反应模式改变有关，例如腹侧被盖区激活降低、执行控制网络的任务相关连接减弱。

虽然这些神经层面的证据数量有限，不能单靠它们做出因果判断，但与行为数据结合在一起，形成了相对一致的图像：

**在重度短视频（或更广义的社交媒体）使用者身上，可以同时观察到：

注意与抑制任务的行为表现下降；

与注意控制和执行功能相关脑区的活动或结构差异。**

这种一致性增加了“短视频使用与注意控制困难相关”的可信度。

5.4 理论解释：习惯化、敏化与“短平快”环境

论文在讨论中借用了 Groves 和 Thompson（1970）的“习惯化—敏化双重理论”，用以解释注意力与抑制功能为何会与短视频使用相关。

这一理论可以简要概括为两条相互交织的过程：

习惯化（habituation）
- 长期暴露在高度刺激、节奏极快的内容环境中，大脑会逐渐对这类刺激“脱敏”；
- 与之相比，阅读、写作、复杂问题求解等慢节奏、需要持续投入的任务，在主观体验上会显得越发“无聊”“费劲”；
- 结果是：认知耐力下降，维持注意力的时间缩短。
敏化（sensitization）
- 短视频平台通过算法不断推送个体偏好的高奖赏内容，伴随即时反馈（点赞、评论、下一条更“对味”的视频）；
- 这会强化一种“快速寻找下一个更刺激内容”的动机模式和注意倾向；
- 大脑逐渐习惯于迅速放弃当前刺激，追逐更新、更强的新刺激。

在这一框架下，可以理解为什么注意与抑制控制会首当其冲：

注意系统被长期训练在“快速切换、浅层扫描”的模式上，在需要持续投入同一任务时就显得吃力；
抑制系统不断面对“再刷一个”“再看一会儿”的诱惑，在平台界面设计的刻意强化下，容易发展为自动化的点击与滑动行为，抑制失败的概率增加；
在较长时间尺度上，这种模式有可能迁移到屏幕之外的生活任务中，表现为更难抵抗即时诱惑，更难维持长期目标导向的行为。

需要强调的是，作者在文中保持了方法论上的谨慎态度：这些解释只是一种与现有数据相容的理论框架，并非已经被纵向或实验研究完全证实的因果路径。

5.5 对学习、工作与日常任务的潜在影响

注意力与抑制控制在认知体系中扮演着“底层调度器”的角色。Diamond（2013）的工作早已指出：阻止不相关反应、维持当前任务目标，对于学业成绩、工作表现以及很多日常生活功能都具有基础性作用。

在本综述的视角下，短视频使用与注意力、抑制控制之间的中等负相关，至少提示了几个现实层面的含义：

学业与学习情境
- 对学生而言，阅读理解、解题训练、写作等任务都依赖持续注意和抑制干扰；
- 若日常大量时间投入到高刺激的短视频中，即便课堂上没有立即“看手机”，注意力系统也可能更难适应长篇文本和复杂推理。
工作与专业任务
- 对需要长时间专注的工作（编程、写作、数据分析、科研、设计等），轻微的注意与抑制功能弱化，就可能表现为：
  - 更容易被消息和新内容打断；
  - 更难进入“深度工作”状态；
  - 在需要克制即时分心冲动时频繁失败。
日常生活与自我管理
- 在日常安排中，“先把这件事情做完，再刷一会儿”的能力，本质上依赖抑制冲动和维持目标；
- 若短视频使用以问题性使用形式存在，这种目标维持能力就会受到更多挑战，表现为拖延、时间感混乱、睡前难以收手等问题。

当然，这些含义仍然停留在“基于相关的风险提示”层面，并不能取代个体评估或临床诊断。但从群体数据来看，注意力与抑制控制确实是当前短视频研究中最值得警惕、也最需要精细化跟进的认知环节。

未来要回答的关键问题包括：在多大程度上，这些注意与抑制困难是短视频使用造成的结果，而在多大程度上，是原本就存在困难的个体更容易沉迷短视频——这一点将在后文关于研究局限与机制讨论中再做展开。

六、情绪与心理健康指标的总体图景

与认知部分相比，短视频使用与心理健康之间的研究数量更多、覆盖维度也更广。这一部分的结果勾勒出一幅整体轮廓：短视频使用越多，与更高的主观压力和焦虑、更差的整体心理状态有稳定的弱到中等负相关，但不同指标之间差异明显。

6.1 研究数量与心理健康维度概况

在纳入的 71 项研究中，有 61 项报告了短视频使用与至少一个心理健康指标的关系，并进入元分析。

这些指标按照临床分类与量表内容，大致可分为几类：

情绪与情感症状
- 抑郁（depression）：如 PHQ-9、Beck 抑郁量表等；
- 焦虑（anxiety）：如 GAD-7、STAI 等；
- 压力或应激（stress）：如 Perceived Stress Scale。
整体心理状态与生活质量
- 主观幸福感、生活满意度；
- 一般心理困扰指标（如 GHQ 等）。
人际与主观体验
- 孤独感；
- 自尊；
- 身体意象与外貌相关满意度。
与睡眠和身体状态相关的指标
- 睡眠质量与睡眠时长；
- 白天疲劳感等。

测量方式以标准化心理量表为主，少数研究采用自编题目，但大多能清楚归入上述某一领域。整体样本以青少年与青年成年人为主，研究地域则以亚洲（特别是中国）样本居多，其次是北美和欧洲。

6.2 心理健康整体效应：弱到中等的负相关

将所有心理健康相关效应统一整合后，得到一个总体效应量：

短视频使用与整体心理健康之间的相关约为 r = −0.21，95% 置信区间大致落在 −0.25 至 −0.17 区间，差异显著。

这一数值表明，在大样本的平均意义上：

使用水平越高，心理健康指标平均越差；
效应强度处于心理学研究中常见的“弱效应”范围，但稳定存在。

偏倚检验方面：

漏斗图整体未呈现明显严重不对称；
Egger 回归与 trim-and-fill 调整后，效应量仅有微小变化，方向与显著性保持一致。

因此，“短视频使用与心理健康存在一个稳健的弱负相关”可以视为目前证据下较安全的结论。

6.3 焦虑与压力：最突出的情绪领域

将心理健康进一步拆分到不同子领域后，可以看到效应大小的显著差异：

主观压力（stress）
- 综合效应量约 r ≈ −0.34，接近中等负相关；
- 使用越频繁、问题性使用程度越高，与“感觉压力大”“应对不过来”的主观报告更强相关。
焦虑（anxiety）
- 综合效应量约 r ≈ −0.33，同样接近中等负相关；
- 与广泛性焦虑、社交焦虑等不同形式的焦虑症状量表均有稳定关联。

这两项指标在统计上是整个心理健康部分中效应最突出的：

对压力与焦虑而言，短视频使用水平的变化与症状水平的变化同步程度明显高于其他领域；
这与不少个案经验相一致：高强度使用短视频往往与“总觉得脑子停不下来”“紧绷和不安感增强”等主观体验相伴。

从理论角度看，作者在讨论中提出若干可能路径：

高频接触情绪化、极端观点和冲突性内容，可能加重部分个体的紧张与威胁感知；
短视频常被用作“情绪调节工具”，成为回避现实压力的一种手段，短期缓解情绪，长期却可能不利于问题解决；
晚间或睡前的大量使用侵占睡眠时间，使机体恢复能力下降，从而主观压力与焦虑感累积。

这些解释并不等同于因果证明，但与统计结果在方向上保持一致。

6.4 抑郁、睡眠、孤独与其他心理指标

在其他心理健康指标上，短视频使用同样呈现出负向关联，但效应普遍弱于压力与焦虑。

抑郁（depression）

多数研究报告短视频使用与抑郁症状之间存在小到中等的负相关；
综合效应量整体落在弱效应区间，方向一致但数值低于焦虑与压力；
在部分样本中，高频使用与更高的孤独感、无望感和兴趣缺乏相关。

睡眠与疲劳

关于睡眠的研究数量相对较少，但整体方向一致：
- 高强度短视频使用与更差的主观睡眠质量、更短的睡眠时长、更高的入睡困难和夜间觉醒相关；
- 也与白天疲劳、注意涣散的自我报告相关联。
特别是在睡前使用的情境下，蓝光暴露、内容情绪化和“错过内容”的担忧容易延长入睡潜伏期，形成“越刷越睡不着”的循环。

孤独感与社会联系

多数研究发现短视频使用与孤独感之间存在弱负相关，即使用越多者报告更多孤独感；
但这一关系在控制其他社交媒体使用、线下社交频率等协变量后，效应量有时明显减弱，提示短视频只是孤独体验网络中的一环，而非单一决定因素。

主观幸福感与生活满意度

高使用水平与较低的主观幸福感、生活满意度之间存在弱负相关；
但在不同文化与年龄样本中的一致性略逊于焦虑与压力，部分研究报告不显著关联。

整体来看，这些指标共同构成了一幅“心理负担略有增加”的图景：

在抑郁、睡眠、孤独和幸福感上，短视频使用的负面关联总体存在，但多为弱效应；
与压力与焦虑相比，这些领域可能更受个体性格、生活环境和使用动机等多种因素共同影响，短视频使用只是其中之一。

6.5 测量方式与心理健康效应的关系

与认知部分类似，心理健康结果与短视频使用的测量方式之间，同样存在系统差异：

当使用**“成瘾 / 问题性使用”量表**时，短视频使用与压力、焦虑、抑郁等负向指标之间的相关往往接近或达到中等水平；
当仅使用**“每日时长”“频率”**等指标时，效应多为弱相关，部分研究甚至不显著；
使用强度/依附指标的研究数量较少，效应大小介于上述两者之间。

这表明，在心理健康领域，问题性使用（伴随失控与生活功能受损）与症状之间的联系远比单纯“用得多”要紧密。

综述在这一部分的重点判断可以概括为：

从群体数据来看，高强度、问题性的短视频使用，与更高的主观压力、焦虑以及一系列轻度心理困扰指标有稳定的负向关联；
对于一般用户，单纯使用时长与心理健康之间的关系较弱，个体差异可能更依赖内容类型、使用动机以及原有心理状态；
将所有短视频使用者简单归为“高风险人群”并不符合目前证据，更合理的做法是将注意力聚焦在有明显失控感和功能损害的子群体上。

七、自尊、身体意象与主观幸福感的复杂结果

在大众舆论里，短视频平台几乎天然与“外貌焦虑”“身材焦虑”“低自尊”绑定。但在这篇系统综述里，数据给出的图景并没有想象中那样简单：在汇总层面，短视频使用与自尊、身体意象之间几乎没有系统性关联，而与整体幸福感的关系则偏弱、方向不一。

7.1 总体结果：自尊与身体意象几乎“不动”，幸福感轻微下滑

元分析将与心理健康相关的指标按“领域”分组。在“情绪与困扰”（焦虑、压力、抑郁）中，短视频使用与症状之间呈现弱到中等负相关，这在前一节已经说明。而在“自尊、身体意象、幸福感”这类指标上，情况明显不同：

在综合森林图中，短视频使用与自尊、自我评价的平均相关系数接近 0，不显著；
与身体意象（body image、body esteem）的平均相关同样非常接近 0；
与主观幸福感、总体幸福感和情绪（affect）的关系，呈现弱负相关，但效应明显小于焦虑和压力那一组；
也就是说：
- **“感觉压力大/焦虑”**在高使用者中更常见；
- **“觉得自己丑/身材差、自尊被摧毁”**则没有在数据里形成统一的方向。

论文在摘要中直接点出这一点：短视频使用与认知、心理健康整体呈负相关，但对身体意象和自尊“并无关联”，作者推测这可能与平台上内容类型和创作者高度多元有关。

7.2 单篇研究：正负效应并存，互相抵消

为什么在综合结果里“看不到”明显的自尊和身体意象效应？核心原因在于：不同研究给出了互相抵消的结论。

综述对比了以往关于社交媒体的研究：

早期综述普遍发现，“总体社交媒体使用”与自尊呈弱负相关，与身体意象困扰呈负相关（自尊更低、对身体更不满意）。
但在专门针对短视频平台的研究里，结果极不一致：
- 有研究发现短视频成瘾与自尊更低、外貌焦虑更高相关；
- 也有研究报告：某些使用模式、自主选择的内容，与较高的自尊或更好的身体满意度相关。

论文举了几个方向相反的例子：

一部分研究表明，短视频成瘾、被动浏览与更低自尊、更高外貌焦虑相关联；
另一部分研究则发现，在某些样本中，TikTok 使用与自尊、身体形象呈正相关，尤其是当用户主动参与创作、与熟人互动或者消费“身体积极”“真实身材”类内容时，自我感觉反而有所提升。

当这些方向相反的效应被放到一起来做元分析时，平均值就被“拉平”了：

有的群体因为短视频而变得更不喜欢自己，有的群体则刚好相反。

在 98,000 多人的“大合影”里，两边的效应互相抵消，最后“看起来什么都没发生”。

7.3 内容与场景：不是“刷短视频”，而是“刷什么”

论文在讨论段落里，把关键点压在“内容类型”和“使用场景”上：

元分析发现：身材/外貌相关指标的效应高度不一致，作者认为这不是短视频对身体意象“无影响”，而是不同内容方向把人往不同方向拉；
有的研究样本中，受试者大量接触“滤镜脸”“极端瘦身”“完美身材 vlog”等内容，外貌社会比较更强，身体满意度下降；
另一些研究聚焦“身体积极”（body positivity）或真实身材分享的内容，发现这类内容有时反而提升身体满意度和情绪。

作者提出，短视频平台的高度多样性是关键：

同一个标签下，可以同时出现极度理想化的身材展示、严苛的节食打卡，也可以出现反节食、反外貌羞辱、提倡“普通身体”的内容；
算法会根据个体互动记录调整推送，对不同用户呈现完全不同的信息流；
因此，“短视频使用时间”作为一个粗指标，无法区分：
- 是在看高度理想化的外貌展示；
- 还是在看“身体积极”“普通人生活”或与外貌无关的内容。

在这种条件下，平台级别的数据自然给不出单向结论：对某些用户，短视频加剧了外貌比较和自我否定；对另一些用户，则提供了认同、共鸣和支持的资源。

7.4 理论视角：使用与满足、社会比较与“谁在比较”

论文借用了两条经典理论来解释这种复杂图景：使用与满足理论（uses and gratifications）和社会比较理论。

（1）使用与满足理论

核心观点：人不会随机使用媒介，而是带着特定需求来“选内容”，包括：

娱乐、放松；
社交联系、归属感；
自我提升、信息获取；
自我呈现与认同建构。

对应到短视频：

以娱乐为主的用户，可能更多浏览搞笑、日常 vlog，对自尊和身体意象的直接冲击相对有限；
希望获得“自我提升”的用户，会主动选择健身、学习、成长类内容，若内容基调健康，反而可能增强自我效能感与自尊；
以“打发孤独”“逃避情绪”为主要目的的用户，更容易形成问题性使用，与抑郁、焦虑和低自尊形成相互强化。

（2）社会比较理论

Festinger 的社会比较理论指出，人们会将自己与他人比较，并据此评价自我。

在短视频环境中：

向上比较（upward comparison）：频繁接触“完美身材和生活”的视频，更容易觉得“自己不如别人”，带来自卑和外貌焦虑；
向下比较（downward comparison）：看到比自己更 “糟糕”的情境，有时会短暂提升自我评价；
如果平台推送的是“真实身体”“失败经历＋恢复过程”等，更容易产生共鸣和自我接纳，而不是自我攻击。

综述指出，已有部分短视频研究发现：社会比较倾向越强的人，更容易在使用过程中形成负面体验，例如在 TikTok 使用与自尊关系中，社会比较会显著放大负效应。

因此，最终出现的“平均 0 效应”更像是以下两类人加在一起：

对比较不敏感、或刻意选择支持性内容的人，自尊受到的冲击较小甚至有所提升；
高比较倾向、偏好理想化内容的人，负面外貌比较和自我否定更强。

7.5 主观幸福感：轻微下降、但受多重因素共同影响

与自尊和身体意象不同，主观幸福感和生活满意度在元分析中呈现的是弱负相关：短视频使用越多，平均幸福感略低，但效应不大。

这组结果背后，同样存在多重交织的因素：

部分研究发现，短视频成瘾与更低的生活满意度、幸福感相关，中介变量包括拖延、空虚感、压力等；
也有研究指出，某些平台上的积极人际互动、创作输出和成就感体验，与幸福感正相关；
在控制总体社交媒体使用、线下社交、人格特质等变量后，短视频使用与幸福感之间的相关往往进一步变弱。

综述给出的判断是：

短视频使用确实与幸福感轻微下降有关，但这一部分效应很难与社交支持、经济压力、原有心理健康状况等因素剥离开；
当前数据不足以支撑简单的因果表述，比如“刷短视频会导致幸福感下降”，更合理的表述是：
- 在高负荷使用的群体里，可以观察到幸福感偏低；
- 但这偏低很可能也是他们原本更焦虑、压力更大、社会支持更弱的反映。

7.6 小结：风险不在“平台本身”，而在“人 × 内容 × 用法”

将这一节的结果压缩成一句话：

在自尊与身体意象上，短视频平台既可能成为放大外貌焦虑的放大器，也可能成为普通身体与多元审美的展示窗口；在主观幸福感上，高强度、问题性使用与幸福感轻微下降相关，但效应远弱于焦虑、压力等领域。

因此，对“短视频是否让人更讨厌自己”这个问题，这篇综述给出的答案既不是“肯定”，也不是“完全没有”，而是：要看是谁、在看什么、为了什么而刷。

八、年龄、平台类型与使用模式的差异图景

前面的分析都在讲“平均效应”。这节换个视角：不同年龄段、不同平台、不同用法之间，风险到底有多大差别。

综述里把这些因素统一当作“调节变量”来检验：年龄分组、平台类型、短视频的测量方式（成瘾、时长、频率等）。结果有一点和很多人的直觉不太一样：年龄差异并不显著，真正拉开差距的是怎么用、用到什么程度，以及用的是哪一类平台指标。

8.1 年龄：青少年和成年人“差不多都中招”

元分析里把样本按年龄分成两类：

青少年：平均年龄不超过 18 岁；
成年人：平均年龄大于 18 岁。

结论非常直接：

年龄组对认知和心理健康的总体效应都不是显著调节变量；
换句话说，短视频使用与健康指标之间的负相关，在青少年和成年人身上强度相近。

作者在讨论里给出的解释要点有两层：

自我调节的作用并没有随年龄消失 其他研究也发现，自我控制、冲动管理这些“自我调节能力”，在青少年和成年人中都稳定地和问题性社交媒体使用相关，并没有因为年龄增加而“自然好转”。这和很多家长的想象不一样：不是“熬过青春期就没事”，而是如果自我调节能力本身一直比较脆弱，那么在任何年龄段面对短视频，都可能发展出问题性使用。
平台设计把年龄差拉平了
- 短视频平台高度刺激、节奏迅速，强烈依赖奖赏系统（多巴胺通路），而这套神经机制在整个生命周期内都相当活跃；
- 无限下滑、即时反馈、个性化推荐等设计，不太“尊重”年龄差异：对青少年有效，对成年人同样有效；
- 结果就是：虽然青少年在认知控制成熟度上确实更脆弱一些，但平台本身的“吸附力”很可能把不同年龄段用户拉到类似的风险水平。

作者也提醒，这并不意味着“青少年和成年人在所有方面完全一样”，而是说：在目前能量化的认知和心理健康指标上，看不到清晰的“只有未成年才危险”的图景。未来还需要更多明确按年龄分层、做纵向追踪的研究，才能看得更细。

8.2 平台类型：TikTok 与“泛短视频”的细微差别

在平台维度上，综述把研究分成两类：

泛短视频使用：问的是“短视频应用/短视频内容”整体，不指明具体平台；
TikTok 专门研究：问的是 TikTok（或抖音）使用或成瘾。

从样本比例看，大约一半研究写的是“短视频整体”，另一半是专门看 TikTok。

元分析发现：

平台类型是显著调节变量；
泛短视频使用的平均负相关略强于 TikTok 单一平台的负相关。

这个结果乍看有点出人意料——很多人以为 TikTok/抖音“最上头”，但从数据看，只盯着 TikTok 可能还低估了整个短视频生态的风险。作者在讨论里提到几个可能原因：

泛短视频变量覆盖的内容更杂
- 一些研究把多个平台（TikTok、快手、B 站短视频、Instagram Reels 等）统称为“短视频”，统一纳入；
- 对这些人来说，问题往往不是“某个 app 有毒”，而是停不下来的多平台组合，风险更大。
TikTok 样本本身较为集中的用户群体
- TikTok 专门研究往往集中在某些特定群体（如大学生），控制变量较多；
- 反而使得效应量在统计上“收窄”，看起来没有泛短视频指标那么“夸张”。
平台内部功能差异被忽略
- 很多 TikTok 研究只用一个总分，没区分刷首页、看直播、看带货、看学习视频等具体功能；
- 这些功能可能在心理效应上方向不同，但被平均在一个分数里。

综述的结论是：不能简单把“风险”全部投射在 TikTok 上。在现实生活里，用户往往是跨平台、跨内容地连续刷，真正重要的是整体使用模式，而不是单个 app 的名字。

8.3 使用模式与测量方式：谁把效应拉大，谁把效应拉平

这一点在前面已经出现过，但在“调节变量”里，作者又做了一次系统比较：

短视频测量方式本身是显著调节变量；
不同测量方式，得到的效应量差别很大。

综合结果可以简单概括成一条梯度：

成瘾 / 问题性使用（addiction/problematic use）
- 和认知、心理健康的负相关最强，达到中等效应；
- 量表直接测“停不下来”“影响生活”“内心很烦躁”等症状，本身就嵌入了“已经出问题”的信息。
使用时长（duration）
- 与健康指标的负相关通常为弱效应；
- 说明“刷得久”的确总体风险略高，但远不如“刷得失控”关键。
是否使用／一般使用状态（usage）
- 只区分“用 vs 不用”，与心理健康也是弱负相关；
- 信息太粗，更多反映的是“有没有接触过这类平台”。
使用频率（frequency）与使用强度（intensity）
- 就心理健康而言，这两类指标在元分析中基本不显著；
- 但有一项研究发现，强度指标（情感依附、自动化使用程度）与认知表现之间的负相关非常强，只是目前样本太少，还不能做出稳固结论。

作者的解读很清晰：成瘾量表、时长、是否使用这三类指标相对标准化、结构清楚，而频率和强度的量表五花八门、质量参差不齐，这本身也会拖低效应的一致性。

另外，综述还引用了几篇单独的“使用模式”研究：

有研究用潜在类别分析把青少年的短视频使用分成“低使用”“社交导向使用”“高度逃避＋成瘾使用”等几类，发现真正心理风险高的是**“逃避压力＋高成瘾”的那一群**；
也有研究指出，在高压力人群中，刷短视频很容易被当成“逃避工具”，压力→逃避性刷视频→成瘾，这条路径一旦形成，焦虑、睡眠差、自评健康变差就会叠加出现。

从调节分析和单篇研究拼在一起，可以得到一个非常稳定的信息：

真正拉高风险的，不是某一个平台的 logo，而是**“高压力 + 差自控 + 以逃避为主的高强度使用模式”**。

8.4 小结：年龄不再是唯一焦点，模式才是核心

这一节可以压缩成三点：

年龄不是“保护伞”
- 在当前数据下，短视频使用与健康的负相关在青少年和成年人身上都存在，强度相近；
- 自我调节能力如果薄弱，不论年龄多大，面对这种高刺激平台都容易陷入问题性使用。
平台类型有差别，但不是“谁最毒”的简单排名
- 泛短视频使用的效应平均略强于单一 TikTok 研究；
- 用户现实中的高风险模式往往是多平台叠加刷，而不是只有一个 app。
决定风险高低的，是“怎么用”
- 成瘾/问题性使用量表与健康的负相关最大，其次是时长和是否使用；
- 在高压力、逃避性动机强的人群里，这种问题性使用最容易出现，也最需要被识别和干预。

因此，相比于只盯着“青少年”“TikTok”这些标签，这篇综述更倾向于一个结论：风险是“人 × 内容 × 用法”的交织结果。年龄和平台是背景，更关键的是：这个人带着怎样的压力和需求，用什么方式，把多少生活时间交给了短视频。

九、研究方法的优势、局限与改进空间

这一部分不再重复统计结果，而是站在“怎么做研究”的角度，看看这篇系统综述和元分析本身做得好的地方、目前的短板，以及接下来值得补强的方向。

9.1 方法上的亮点：为什么值得当作“基准文献”来看

（1）规范完整的系统综述流程

这项研究严格按当代循证标准来做：

按 Cochrane 手册 设计整体流程；
报告遵循 PRISMA 2020 和心理学元分析报告规范；
方案事先在 PROSPERO 注册，有清晰的检索策略、纳入标准和计划的调节分析；

这种“先立规矩，再做事”的做法，减少了研究者事后“挑结果”“挑分析”的空间，可信度比很多即兴综述要高。

（2）数据量大而且维度多

共纳入 71 项研究、98,299 名被试，是目前关于短视频使用与健康关系中规模最大的综合之一；
不只看心理健康，还同时纳入 注意力、抑制控制、记忆、推理等多个认知任务；
不只看 TikTok，还覆盖“泛短视频使用”；
不只看“用多久”，还区分 成瘾 / 问题性使用、时长、频率、强度、是否使用 等不同指标。

这意味着：它不是单点结论，而是一张相对完整的“结构图”。

（3）元分析细节扎实

在统计技术上，作者做得也比较“规矩”：

用 相关系数 r 作为统一效应量；组间比较先换算成标准化均差，再转成 r，保证不同设计能放在一起比较；
采用 随机效应模型，承认不同研究本身存在真实差异，而不是简单假设“所有研究估计的是同一个真值”；
用 Q 和 I² 系统评估异质性，再通过调节分析去解释这种差异来自哪里（年龄、平台、测量方式、健康领域等）；
系统检查发表偏倚：漏斗图、Egger 回归、trim-and-fill，给出偏倚调整前后的效应量对比；

（4）敏感性分析做得足够“啰嗦”

作者不满足于“跑完一个模型就收工”，而是系统地测试了结论是否稳健：

比较 随机效应 vs 固定效应 的结果；
比较 高质量研究 vs 低质量研究 的结果（用 MMAT 评分 0–5 打分）；
比较 相关研究 vs 组间研究 的结果；

这些敏感性分析显示：不管换哪种合理的统计假设，“短视频使用与认知、心理健康之间存在稳定负相关”这一点并不会消失。

（5）透明度与开放科学

研究明确声明没有使用生成式 AI 做设计、提取、分析和写作，只使用常规文献管理和拼写检查工具；
协议、数据和代码上传到 OSF 等开放平台，方便其他研究者复查和再分析。

在当前“数字媒体研究鱼龙混杂”的背景下，这样一篇透明度高、方法扎实的文章，很适合作为之后相关讨论的“标尺”。

9.2 关键局限：哪些问题这篇论文也解决不了

优势很多，但作者自己也很坦诚，这篇综述有几类结构性局限，很难靠一次汇总就解决。

（1）绝大多数是横断面研究，方向性说不清

纳入的研究以 横断面相关和组间比较 为主，很少有真正的纵向或实验设计；
这意味着：无法从统计结果中推出“因果顺序”——是刷短视频导致压力和注意力问题，还是本来就有压力和注意困难的个体更容易沉迷短视频，两种解释在数据上都成立。

作者也明确提醒：论文里虽然沿袭系统综述的惯例，用“outcome（结局变量）”这个词，但从严格角度讲，这些变量更适合被叫作 “相关指标（correlates）”，而不是已经被证明是“后果”的东西。

（2）认知和身体健康的覆盖仍然不够

相比心理健康，真正做认知任务的研究还不多，而且高度集中在注意力和抑制控制上；
记忆、工作记忆、推理、规划等领域的研究数量很少，效应估计不够稳定；
身体健康（如体重、代谢指标、久坐行为）几乎没有系统数据，只能在讨论中提一提。

换句话说，现阶段的证据图景在“注意力－抑制－焦虑－压力”一带最清楚，其他维度仍然是“模糊影像”。

（3）平台范围有限，重心仍在 TikTok 与“泛短视频”

虽然这篇综述比早期工作更努力地把 “泛短视频” 纳入进来，但真正对 Instagram Reels、YouTube Shorts、Facebook Reels 等单独做系统研究的几乎没有；
对于被墙或被限制的平台（例如 TikTok 在某些国家），研究者会转向抖音或其他替代品，但总体来说，平台生态的真实复杂性在样本里还原得不够好。

这导致一个后果：现在的结论更适合作为“短视频整体”的基线，而不是对某个平台做精细评估。

（4）测量工具参差不齐，自陈为主，缺少客观记录

在成瘾和时长这些指标上，量表相对标准化；
在频率和强度上，量表“百花齐放”：有改编的，也有自编的，题目和计分方式差异很大，可靠性未知；
所有研究几乎都依赖 自我报告，很少接入真实使用日志或屏幕时间记录。

元分析的结果也直接反映了这一点：

成瘾、时长、是否使用这些指标和健康的负相关比较稳定；
频率和强度在心理健康上的效应基本不显著，很大程度上可能是 测量噪音 把信号淹没了。

（5）样本集中在某些地区和人群

大量研究来自中国和更广泛的亚洲地区，中学生、大学生是绝对主力；
临床样本、低收入国家、年长人群等，在目前数据中几乎缺位；
在文化维度上，短视频的使用动机、家庭结构和监管方式可能非常不同，但这类因素目前很少被系统测量与分层。

（6）内容层面的信息严重不足

作者多次强调：目前大多数研究只知道“刷了多久”“多上瘾”，不知道具体“刷了些什么”。

几乎没有系统的内容编码（例如：情绪色彩、暴力程度、外貌聚焦、教育信息等）；
很少有研究同时测量 内容类型、使用动机、观看时的情绪体验。

这也就解释了，为什么在身体意象、自尊这些领域，平均效应接近 0：不同内容可能把人往完全相反的方向拉，而现有数据没办法拆开看。

9.3 改进空间与未来研究方向：从“用多久”走向“怎么用”

结合上面的优势和局限，可以看到未来研究有几条非常清晰的路。

（1）从横断面走向多波段、实验和干预

要想搞清楚“谁先谁后”，至少需要：

纵向研究：追踪同一批用户半年或几年，观察短视频使用变化与注意力、焦虑等指标的时间顺序；
实验与准实验研究：
- 有控制地限制或增加短视频使用一段时间，观察认知和情绪指标的前后变化；
- 或者操控“使用方式”（如只关注熟人内容 vs 只看推荐内容），比较对心理状态的影响。

只有当时间顺序被拉长，干预条件被清晰操控，才有可能从“相关”慢慢逼近“因果路径”。

（2）把“内容、动机和情绪”放进模型

论文建议，未来的数字健康研究应当强调：不是只看“多少量”，而是看“什么内容＋为什么＋看完什么感觉”。

更具体的改进包括：

在量表里同时记录：
- 内容类型（学习/娱乐/带货/情绪宣泄等）；
- 使用动机（放松、拖延、逃避压力、获取信息、社交认同等）；
- 使用过程中的即时情绪（感到被理解？羡慕？紧张？麻木？）；
对公开视频做系统内容分析，例如编码外貌聚焦程度、正负情绪、冲突与极端观点的比例；
把这些变量放进结构方程模型或中介模型里，测试“压力 → 逃避性动机 → 成瘾使用 → 焦虑/失眠”等链条。

这样，短视频与健康之间的关系图会从一根“粗线”变成一张更精细的“关系网”。

（3）多源数据：把客观使用记录和实验任务拉进来

未来的测量可以更“硬核”一些：

与平台或操作系统合作，获取匿名化的 真实使用时长、打开次数、使用时段；
在实验室里用 行为任务＋脑电/成像指标 同步记录：看短视频前后，注意力、抑制控制等具体指标怎么变；
结合可穿戴设备记录 睡眠、心率、活动量，把身体指标拉进来。

这些做法可以显著降低自陈偏差，也能在更细粒度上观察“短平快内容”对大脑和身体节律的影响。

（4）平台与文化的多样化：跳出 TikTok 单一视角

综述提醒，当前研究过于集中在 TikTok 和少数国家：

未来需要系统地比较 Reels、Shorts、本地化短视频应用 等不同平台，看看算法逻辑、社区文化差异是否会体现在健康效应上；
在文化层面，引入不同国家、不同监管环境和家庭结构的样本，考察同样的使用模式在不同文化中的心理后果是否一致。

（5）更精细地刻画“人”的差异

这篇综述已经指出，自我调节和奖赏系统的特点，很可能比年龄本身更关键。

未来研究可以更多关注：

自控力、拖延倾向、无聊敏感性、情绪调节方式等特质；
社会支持、校园环境、家庭规则、对平台的认知和信任；
如何通过运动、心理训练、数字素养课程等方式，增强高风险群体的应对能力。

（6）从“简单管控”转向“设计更友好的使用环境”

论文最后也提到政策与平台设计层面的议题：

一方面，确实需要针对未成年用户的特殊保护、数据隐私和劳动权利的监管，例如“娃娃博主”的权益问题；
另一方面，短视频也被证明可以在性教育、健康传播等领域起到积极作用，简单的“一刀切封杀”并不现实；

未来更有建设性的方向，是用研究结果去反推：

哪些设计（比如默认关闭自动播放、提供使用时间反馈）有助于控制使用；
哪些内容形式（例如强调真实身体、多元生活样态）可以缓冲社交比较的负效应；
如何把教育、公共健康信息嵌入短视频生态，而不是把它当作纯粹的风险源。

十、潜在心理与神经机制的综合讨论

短视频使用和认知、心理健康之间的相关，并不是几条相关系数就能解释清楚的简单对应关系。论文在讨论部分把已有行为、脑成像和情绪路径研究串在一起，大致勾勒出一组互相咬合的机制：注意系统被重塑，奖赏系统被高频调动，情绪调节方式逐渐外包给算法驱动的内容流，再叠加个人特质与环境压力，最终形成现在观察到的“中等认知负相关”和“弱到中等心理负相关”。

10.1 从“习惯化–敏化”到碎片化注意

作者把短视频对注意和抑制控制的影响，放进 Groves 和 Thompson 的双重理论 来理解：习惯化与敏化同时发生。

习惯化：长期暴露在高刺激、节奏极快、强对比的短视频内容中，大脑会对这种强度的刺激逐步脱敏。与之相比，阅读长文、做题、写报告这类慢节奏任务在主观体验上越来越“淡”和“费劲”，认知耐力变短，对持续性任务的耐受度下降。
敏化：同时，平台通过个性化算法，不断推送刚好“戳中”兴趣点的内容，并且每次滑动都带来即时反馈（新鲜感、笑点、争议、情绪共鸣）。这种高频、小剂量的奖赏让大脑越来越倾向于迅速放弃当前刺激，追逐下一个更吸引人的视频，快速切换变成默认模式。

在这套机制下，注意系统的工作方式发生了偏移：

神经层面，重度短视频或社交媒体用户在注意任务中的 P300 波幅更低，说明在处理罕见、重要信号时投入的注意资源减少，警觉性下降。
行为层面，在持续注意、Go/No-Go、Stroop 这类任务中，高使用者更容易漏检、冲动反应和被干扰拖慢反应速度。

综合这些结果，论文提出一个相对谨慎但具有解释力的判断：频繁刷短视频会把注意系统训练成“高频切换、浅层扫描”的模式，而在需要持续、深入投入的任务上，表现出中等程度的劣势。

10.2 多巴胺奖赏系统与“越刷越平淡”的日常生活

短视频的另一个关键机制在于 多巴胺奖赏回路。已有的脑成像研究显示，个性化推送的视频会激活默认网络和腹侧被盖区等与奖赏加工相关的区域。

这篇综述整合了社交媒体和短视频的神经影像证据，提出几个相互连通的观察：

高频使用者在 前额叶皮层和纹状体奖赏回路 中，表现出结构或功能上的差异，提示执行控制和奖赏敏感度发生了长期调节；
问题性社交媒体使用与 腹侧被盖区（VTA）激活降低、执行控制网络任务相关连接减弱 关联，反映出奖赏通路与控制网络之间的平衡被打破；
在心理健康部分的综合中，作者指出：短视频平台通过算法驱动的内容流，可能形成一种“高频奖赏、阈值上调”的过程，日常生活中的普通回报显得越来越不够“刺激”，易感焦虑和抑郁的风险随之增加。

可以把这一逻辑简化成一条链：

高度个性化的内容流 → 高频小剂量多巴胺释放 → 日常活动相对失色 → 对普通事物兴趣下降、寻求更强刺激 → 焦虑、空虚感和情绪波动更频繁

综述强调，这些证据仍然是相关性质，但与行为结果在方向上高度一致，支持“短视频使用与奖赏系统适应性变化相关”的推断。

10.3 情绪调节路径：从“解压小工具”到“逃避性习惯”

在心理健康部分，压力与焦虑的效应明显高于抑郁和幸福感，这和大量单篇研究中的 情绪调节路径 有直接关系。

多篇实证研究把短视频成瘾建模为“压力 → 逃避性动机 → 问题性使用 → 情绪困扰”的链条：

在高压人群中，短视频被频繁用作“放空大脑”“不想面对现实”的工具，短期减压、长期拖延问题解决；
逃避动机、无聊耐受度低、痛苦耐受度低，会明显增强压力对成瘾使用的传导效应；
问题性使用又通过睡眠质量下降、作息紊乱和社交退缩，反过来加重抑郁和焦虑症状。

在这篇元分析中，作者因此特别强调：

单纯“用得多”的人群和“以逃避压力为主的成瘾用户”在机制上不同；
前者更多体现的是时间占用问题，后者则兼有 情绪调节失衡、压力循环加重、日常功能受损 等多重路径。

如果把注意系统的变化看作“硬件层”的适应，那么情绪调节方式的改变就是“软件层”的偏移：

负面情绪出现时，优先选择打开短视频 app，而不是运动、与人交流或解决问题；
获取安慰与分散注意的主要途径变成了算法推荐的内容，个人对情绪管理的主动性逐渐减弱；
一旦这种模式在高压环境中固化，成瘾量表上的多项症状（失控感、戒断感、冲动使用）就容易同时出现。

10.4 时间感、睡眠与生理节律的错位

短视频平台还有一个经常被忽略的机制，是对 时间感知和睡眠节律 的影响。

现有研究中，有几条线索值得注意：

实验和调查都发现，重度短视频用户的时间感更容易扭曲，主观上常常低估已经刷过的时间长度，出现“只刷了几分钟”但实际已经过去半小时或更久的情况。
睡前的自动化刷短视频与 入睡前认知唤醒增加、第二天疲劳 显著相关，即大脑在躺在床上时被重新激活，很难平静下来。
短视频成瘾还通过缩短睡眠时长、打断睡眠连续性，把睡眠质量拉低，间接增强抑郁、焦虑和自伤意念等心理风险。

综述在讨论中把这些现象放进一个更大的框架：

晚间本应是 情绪“冷却”、认知负荷下降、身体修复 的时间段；
高频、情绪强烈、光线刺激大的短视频内容，会在这个阶段给神经系统再加一轮负荷；
长期下来，睡眠不足与“白天精力差、对工作学习的耐心下降”叠加，进一步推高“刷视频逃避”的诱惑。

这条路径不像注意和奖赏那样直接，但对整体健康的侵蚀非常稳健，特别是在青少年和大学生样本中，睡眠变量往往是短视频成瘾与情绪症状之间的重要中介。

10.5 “人—情境—平台”的综合视角

作为收束，论文引用了 Xiong 等提出的多维框架，强调短视频问题性使用是 个体因素、社会环境和平台设计三者交互的结果。

在这个视角下：

个体层面：自我调节能力、冲动性、无聊敏感度、既往焦虑抑郁水平，会显著影响一个人多大程度上依赖短视频来调节情绪、获得奖赏。
社会环境层面：校园与家庭的规则、同伴的使用规范、现实压力的大小、可替代的休闲方式，会决定短视频在日常生活中的“位置”，到底是众多选择之一，还是几乎唯一的出口。
平台与内容层面：算法推荐策略、自动播放、提醒机制，以及内容中外貌比较、极端情绪、争议话题的比例，都会改变奖赏系统被调动的频率和强度，也会左右社会比较和情绪感染的方向。

元分析的一个重要结论，是在自尊、身体意象这些领域上，平均效应接近零，很可能就是 不同内容和不同使用方式把人往相反方向拉 的结果。

因此，在机制层面，更合理的图像不是“短视频天然有害”，而是：

它提供了一个 极易塑形、极易放大的环境；
在压力大、自控弱、动机偏逃避的情境下，这个环境会放大认知和情绪的脆弱点；
在内容多元、动机较为主动和建设性的情境下，同一平台也可能被利用为学习工具、社会支持来源，甚至正向的自我呈现空间。

十一、对个体、家庭与平台治理的实践启示

这一节不再停留在相关系数，而是把前面几部分串起来，转换成可以落地的做法：个体怎么用、家庭怎么管、学校怎么配合、平台和政策层面能做些什么，才能在承认短视频已成“常态环境”的前提下，把风险压低一些。

11.1 对个体用户：从“戒掉”转向“改用法”

对大多数人来说，短视频已经很难完全戒除，更现实的方向是把它从“失控的默认行为”变成“带着目的的工具”。

1. 把“成瘾感”当成比“时长”更重要的警报

不是所有每天刷一小时的人都有问题，但如果符合以下几条，就需要认真对待：

明知道明天有重要任务，还是一刷就到凌晨；
不刷会明显焦虑、发空，手会不自觉去点图标；
多次下定决心减少使用，但总是失败；
刷完并没有真正放松，反而更烦躁、更自责。

如果这些情况频繁出现，可以默认自己已落在“问题性使用”的区间，而这正是研究里认知和心理健康风险最高的那一群。

2. 给短视频设“边界”，而不是指望意志力

单靠“以后少刷一点”通常撑不过几天，更实际的是把边界写出来、做出来：

限定时段：尽量避免早起第一件事和睡前最后一件事是刷短视频；比如规定“睡前半小时只看纸质书或听播客”，把手机放在离床远一点的位置。
限定场景：比如不在吃饭、学习、开会、排队等场景刷；可以只把它留给“下午茶时 20 分钟”这种明确的休息槽。
配合工具：使用系统或第三方的用时统计与限额功能，超时自动弹窗或锁定；真正有效的不是完全封死，而是“逼自己对每一次解锁做一次有意识选择”。

3. 用“切换成本”保护深度任务

短视频最大的特点是切换顺畅——手指一划，大脑就被带走。可以反过来人为增加一点点“摩擦”：

学习或工作时，把短视频 app 放到第二、第三屏，甚至单独放进一个文件夹；
把学习/写作常用软件固定在主屏，把“打开短视频”的路径刻意加长；
需要专注时，给自己设一个固定时长的“飞行模式时间段”，哪怕只有 25 分钟。

这不是彻底杜绝，而是在关键任务期间，暂时把注意力系统和奖赏系统从短视频环境“抽离”出来。

4. 主动选择内容，少做“算法的被动观众”

在自尊和身体意象这类变量上，数据之所以混乱，很大程度是因为内容差异巨大。对个体来说，一个直接可行的做法是：

主动关注教育、技能、真实生活、身体积极等账号，把首页改造得更“友好”；
对明显让自己焦虑、比较、愤怒的内容，干脆拉黑或点“不感兴趣”；
把短视频的一部分使用时间换成“有结束点”的内容形式（比如一整集播客、一段课程），降低“无限下滑”的比例。

简而言之：尽量让短视频的使用更多指向“获得信息、练习技能、获得支持”，少指向“无止境比较和逃避”。

11.2 对家庭与学校：从“盯屏幕”转向“盯状态”

家长和老师常见的反应是：控制时间、严禁使用。研究结果提示，时间固然重要，但真正需要被关注的是“状态”：孩子是不是在用短视频逃避压力、自我调节能力是不是越来越弱。

1. 把“讨论使用方式”放在“限制时长”之前

如果对话只停留在“每天只能刷 30 分钟”，孩子很容易把全部精力用在和规则对抗上。更建设性的讨论包括：

为什么会想刷短视频？是无聊、压力大、孤单，还是纯放松？
刷完之后，是不是感觉更轻松，还是更空虚、更烦躁？
有没有其他方式可以达到类似的放松或社交效果，比如运动、游戏、和朋友聊天？

当孩子能说清楚“什么时候会想刷、刷完是什么感觉”，才有可能一起讨论替代方案，而不是只有“打压和躲避”。

2. 重点盯三个信号：成绩波动、睡眠、情绪起伏

研究显示，短视频使用和风险主要通过注意力、睡眠、压力和焦虑表现出来。家庭与学校可以重点留意：

成绩或作业质量是否在短期内明显下滑；
是否经常熬夜刷视频、早起困难、白天打瞌睡；
情绪是否变得更烦躁、易怒或明显退缩。

如果这三个维度持续恶化，就不再是简单的“娱乐时间问题”，而更接近一种“数字行为与身心健康的双向恶化”。这时，适当寻求学校心理老师或专业机构的帮助，比单纯增加管控更有意义。

3. 家庭要给出“替代的奖赏”和“可谈论的空间”

在很多高风险个体中，短视频之所以成为主渠道，是因为现实生活里替代选项太少：

家庭几乎只有“学习”和“不要玩手机”两种话题，很少真正讨论兴趣、情绪和压力；
学校里可参与的兴趣活动单一，能获得成就感和归属感的场域有限；
大人自己也每天在手机屏幕里沉浸，却要求孩子“做到我做不到的自律”。

在这种背景下，单靠严格时间限制，很难从根本上改变孩子与短视频的关系。比起“盯着他有没有刷”，更重要的是：

提供稳定的现实社交和活动机会，让孩子在“线下生活”里也能获得奖赏感；
留出能谈论情绪和压力的空间，让“刷短视频”不再成为唯一的出口；
以身作则，在家庭中共同约定“吃饭不看手机”“睡前半小时不刷”等简单可执行规则。

11.3 对平台与产品设计：把“上瘾特性”用来做减法

从研究结果看，风险最高的是“停不下来、失控而使用”的模式，而这种模式与产品设计密不可分。平台如果真要承担社会责任，至少可以在几个方向上做减法和结构性改造。

1. 降低默认的“自动引导强度”

可以考虑将一些“强推行为”改成“选择性行为”：

自动播放、自动下一条改为可见且易操作的开关，默认关闭；
向下滑动时，在一定时长后弹出软提醒（提示已使用 xx 分钟），鼓励用户中止或切换到别的活动；
对于未成年账号，将连续观看时间硬性分段，例如每 30 分钟强制进入一个“停顿页”，需要主动确认才能继续。

这些设计不会完全抹掉平台的吸引力，但能把“一刷到底”的惯性切割成更小的单元，为用户保留更多暂停点。

2. 扩大“健康内容”的可见度

研究显示，短视频对自尊和身体意象的影响高度依赖内容方向。平台完全有能力用算法权重，给某些内容更多机会：

对身体积极、多元审美、真实生活内容给予更高推荐权重；
在搜索外貌、减肥、身材相关内容时，主动插入科学信息、心理教育或资源链接；
对明显鼓励极端节食、自残、自我否定的内容加强识别与管控。

同样地，对于健康传播、心理科普、学习技能类内容，平台可以在用户处于高使用时段时增加推送比例，为“无目的滑动”提供一些正向的“打断”。

3. 提供更细颗粒度的“自我管理工具”

目前多数平台只提供简单的“使用时长统计”，但在研究图景中，真正重要的包括：使用时间段、连续使用时长、情绪状态等。平台层面可以：

在个人主页中展示更清晰的使用画像，如每日高峰时段、平均连续观看时长；
提供可选的“情绪标记”功能，让用户可以简单标记“心情差时刷”的频率；
对于明显出现“睡前高频使用 + 白天高频短暂打开”的模式，推送温和的自我管理建议。

这些工具的意义不在于“帮平台免责”，而在于把信息反馈给用户自身，让人有机会意识到自己的使用模式正在朝问题性使用靠拢。

11.4 对政策与监管：从“妖魔化”走向“精细治理”

在政策层面，这篇综述提供的不是简单的“好或坏”判断，而是一些可供监管框架参考的支点。

1. 将短视频纳入更广义的“数字健康”议题

目前很多政策讨论仍停留在“防沉迷”“未成年保护”框架内，但从研究图景看，注意力和情绪负担问题并不限于未成年人，也不限于娱乐内容。更合理的是：

将短视频与游戏、社交媒体等一起纳入“数字健康”策略，关注不同年龄阶段的风险点；
鼓励学校和社区在健康教育中加入“数字行为与心理健康”的模块，而不仅是“防网瘾”。

2. 对算法和商业模式提出“可解释”与“可选”的要求

短视频平台的核心问题之一在于算法完全黑箱、以停留时长最大化为目标。监管上可以考虑：

要求平台披露与推荐算法相关的基本信息，尤其是对未成年用户的推荐逻辑；
鼓励提供“非个性化时间线”模式，让用户在需要时可以使用更弱干预的内容流；
对付费推广内容尤其是外貌、身材、医疗美容相关广告加强审查和标识。

3. 针对高风险群体设计更主动的保护机制

鉴于问题性使用与压力、抑郁、睡眠障碍关联显著，政策可以在以下环节做文章：

对“自报存在心理困扰或曾有自伤想法”的用户，限制其夜间使用时长，或引导其接触正向资源；
与公共健康系统、心理服务机构合作，将危机干预信息嵌入平台，例如在搜索自伤相关内容时自动跳出求助信息；
针对儿童网红、未成年人参与创作等灰色地带，完善劳动保护与肖像权益规则。

4. 鼓励平台参与研究与数据共享

当前研究的一大难题是缺乏真实使用数据和细粒度内容信息。政策层面可以：

通过隐私保护和数据脱敏技术，鼓励平台与科研机构合作，开放部分统计层面的使用数据；
支持独立研究者对算法、公平性、心理影响等问题进行审视；
以证据为基础调整监管重点，而不是完全依赖个别极端案例。

整体来看，这篇综述指向的并不是“完全禁止短视频”，而是一个更现实的方向：在承认短视频已经深度嵌入日常生活的前提下，让个体有能力改用法，让家庭和学校有足够线索识别风险，让平台在商业目标之外保留一条“不过度消耗注意力和心理韧性”的底线。

十二、结语：在证据基础上重新理解短视频与“数字健康”

把整篇论文走一圈之后，可以把结论压缩成三个层次：统计上发生了什么、我们应该怎么理解这些数字、以及在“数字健康”这个更大的框架里，短视频意味着什么。

12.1 证据层面的“底线共识”

先把最核心的几条结果重新摆在一起，不过不再展开细节，只讲方向和量级：

在认知层面，短视频使用与总体认知表现之间存在中等程度的负相关，其中 注意力和抑制控制最为突出；
在心理健康层面，短视频使用与心理困扰之间存在弱到中等的负相关，尤以主观压力和焦虑关系最紧密；
在自尊、身体意象和主观幸福感上，综合效应要小得多，有的接近于零，有的轻微负向，而且不同研究之间方向不一。

换句话说，“短视频完全无害”已经不符合数据，“短视频注定毁掉一代人”同样不符合数据。在近十万人的综合样本里，短视频使用与认知、情绪之间的负向关联是真实存在的，但它的形态是：

重点落在注意力维持、冲动抑制、压力和焦虑这些“底层功能”上；
以“群体平均偏移”的形式出现，而不是“每一个使用者都必然严重受损”；
受测量方式、使用模式和个体差异的影响非常明显。

这是这篇综述在证据层面给出的“底线共识”。

12.2 正反叙事之间：既不是“技术恐慌”，也不是“技术无罪”

现实讨论里关于短视频的两种极端说法——

一种是“短视频让人变笨、变浅、变废”，
另一种是“短视频只是一种中性的工具，别妖魔化平台”——

都可以在这份汇总里找到“部分支持”，但都无法作为完整结论。

一方面，注意力与抑制控制的中等负相关，压力和焦虑的弱到中等负相关，确实说明：短视频不是完全中性的环境。在高频、问题性使用人群中，大脑和心理负担的标记已经非常清楚，很难再用“只是玩玩”来轻描淡写。

另一方面，效应的大小、异质性和自尊/身体意象上的复杂结果又提醒我们：

并不是所有人只要刷短视频就会出现严重问题；
很多负向结果集中在已有压力大的个体、情绪调节方式偏向逃避的人群、以及已经发展出“失控使用模式”的子群；
平均效应的另一端，也存在把短视频当作信息来源、技能学习渠道和社交支持空间的人。

所以，更准确的表述不是“短视频是好是坏”，而是：短视频放大了原本存在的心理和环境结构。它可以把注意力上的脆弱点、情绪调节中的薄弱环节、社交比较的敏感节点统统凸显出来，也可以被纳入一个相对健康的使用框架中，为个体和社会提供信息与连接。

12.3 风险的“真正坐标”：人 × 内容 × 用法

这篇综述最大的价值之一，是在大量看似冲突的结论之上，抽出了一个非常清晰的坐标系：

人：自我调节能力、冲动性、无聊敏感度、既有的焦虑抑郁水平，会极大地影响一个人如何使用、依赖和回应短视频；
内容：理想化外貌展示、激烈对立和极端情绪的内容，与身体意象困扰和压力循环联系更紧；真实、支持性和教育性内容则可能在某些人身上发挥保护作用；
用法：纯粹打发时间的轻度使用、学习/创作导向的使用，以及“高压力 + 逃避性 + 成瘾式”使用，是三种完全不同的模式。

在这个坐标系里，“每日使用时长”只是一条很粗糙的指标。真正把风险拉高的是：

压力本就很大；
自控本就不稳；
主要用短视频来麻痹情绪、逃避问题；
现实生活中可替代的奖赏和支持渠道又很有限。

当这些条件叠加在一起时，“问题性短视频使用”就不再是一个简单的娱乐习惯，而更像是一种围绕注意力、情绪和睡眠展开的心理适应模式。

12.4 从个体责任到结构责任：数字健康需要“合伙制”

传统的“网瘾”讨论往往把焦点压在个体身上：自律不够、意志薄弱、家教不严。但这篇综述的结构告诉我们，短视频问题不可能靠“教育用户要自律”这一句话解决。

对个体来说，需要学习的是如何识别自己何时已经滑向“问题性使用区间”，以及如何重建多元的情绪调节方式和奖赏来源；
对家庭和学校来说，需要的是理解孩子/学生在短视频里寻找的是什么——是逃避、陪伴、认同，还是信息和技能——并为这些需求提供部分线下替代方案；
对平台来说，真正的考题是：在不完全牺牲商业目标的前提下，如何利用算法和界面设计降低失控使用的概率，而不是把“上瘾性”视为产品竞争力的一部分；
对政策与研究系统来说，需要的是为数据开放、机制性研究和良性监管创造条件，而不是用一两个极端个案来推动“一刀切禁令”。

这是一套典型的“合伙制”结构：任何一方把责任全部推给其他人，最终都只能得到一个不稳定的平衡。

12.5 将短视频纳入“数字健康”的长线视角

更长远来看，这篇综述实际上是在帮我们调整视角：不再把短视频视为一个孤立的“问题”，而是视为“数字健康”生态的一部分。

在未来的十到二十年里：

屏幕、算法和即时反馈不会消失，短视频只是这一波技术浪潮中的一种表现形式；
人类注意力与情绪调节方式，必然会持续在这样的环境中重塑，而不是退回到前智能手机时代；
因此，与其设想一个“没有短视频的理想世界”，不如认真回答：在一个短视频常态化的社会里，什么样的教育体系、家庭氛围、产品设计和公共政策，能够最大限度地保持认知功能和心理韧性。

这篇论文的贡献在于：它把情绪化的争论，拉回到了一组可被检验、可被更新的数字上。

如果未来有更好的纵向和实验研究出现，这些效应量可以被修正、细化甚至推翻；
如果平台生态、内容结构和用户行为发生显著变化，短视频与健康之间的关系图也可能重绘；
但无论如何，这一次的系统梳理已经为之后的所有讨论提供了一个“起点坐标”：我们从哪里出发，在什么基础上谈风险、谈改变、谈设计。

12.6 小结：在证据基础上，与短视频“谈一场不失控的关系”

把所有内容压缩成最后一段，可以这样理解这篇综述传递的信息：

短视频已经深深嵌入我们的注意力系统和情绪生活，它确实加重了部分人的认知和心理负担，但这种负担既不是必然，也不是不可逆。真正决定风险高低的，不是有没有短视频，而是谁在怎样的压力之下，以怎样的方式、面对怎样的内容在使用它。

从“数字健康”的角度看，我们需要学会的不是如何彻底摆脱短视频，而是：

在数据和证据的基础上，识别哪些使用模式值得警惕；
在生活和制度层面，为自己和他人预留出不被无限滚动内容填满的时间和空间；
在产品和政策层面，让注意力和心理韧性不再是商业逻辑的牺牲品。

当我们能做到这些时，短视频就不再只是一个被动接受、任其摆布的环境，而是一个可以被理解、被改造、被纳入更大“数字健康”规划中的部分——一段可以谈判边界和规则的长期关系，而不是一场注定失控的侵占。

心理健康
认知
tiktok
社交媒体
短视频