关于小红书的数据表,这份表格具体包含哪些核心数据维度?如何通过数据洞察用户行为与平台趋势?
小红书作为一个以UGC(用户生成内容)为核心的社区电商平台,其数据表设计必然围绕“人、货、场”这三个核心要素展开,作为一个内容平台,本身也是独立且核心的一环。
(图片来源网络,侵删)
以下我将从核心业务模型、数据表分类、关键数据表详解、以及数据应用四个方面,为你系统地梳理小红书的数据表。
核心业务模型:人、货、场、内容
理解了小红书的商业模式,就能更好地理解其数据表的设计逻辑。
- 人: 用户、创作者、品牌方、KOL/KOC。
- 货: 商品、笔记、直播、视频。
- 场: 平台、搜索、推荐流、直播间的场景。
- 笔记、图文、视频、评论、点赞、收藏,这是连接“人”和“货”的桥梁。
所有数据表的设计都是为了记录和分析这四者之间的互动关系。
数据表分类
小红书的数据表可以大致分为以下几个核心模块:
(图片来源网络,侵删)
- 用户中心表: 存储用户的基本信息、行为和画像。
- 内容中心表: 存储笔记、视频、直播等核心内容数据。
- 商品/电商中心表: 存储商品信息、交易数据、订单信息。
- 互动行为表: 记录用户与内容、商品之间的所有互动行为。
- 推荐与搜索表: 存储用户偏好、标签、以及推荐/搜索日志。
- 创作者与商业中心表: 针对创作者和品牌方的数据,如收益、广告投放等。
关键数据表详解
下面我们逐一展开每个模块下的核心数据表。
用户中心表
| 表名 (示例) | 核心字段 | 字段说明 |
|---|---|---|
dim_user (用户维度表) |
user_id, nickname, avatar_url, gender, age, city, register_time, last_login_time, user_level, user_type |
存储用户的基础静态信息。user_type 可区分普通用户、创作者、品牌等。 |
user_profile (用户画像表) |
user_id, interest_tags, fashion_style, skin_tone, beauty_concern, following_topics |
存储基于用户行为分析得出的动态标签和画像,用于个性化推荐。 |
user_behavior_log (用户行为日志表) |
log_id, user_id, behavior_type, target_id, target_type, timestamp, device_info, ip_address |
核心行为表,记录用户的一切行为,如浏览、点击、搜索、分享等。behavior_type 是关键,target_type 区分行为对象是笔记、商品还是用户。 |
内容中心表
| 表名 (示例) | 核心字段 | 字段说明 |
|---|---|---|
dim_note (笔记维度表) |
note_id, user_id, title, content, cover_image_url, create_time, update_time, note_status, note_type |
存储笔记的核心元数据。note_status 可标记为正常、删除、隐藏等。note_type 可标记为图文、视频、直播回放等。 |
note_media (笔记媒体资源表) |
media_id, note_id, media_url, media_type, width, height, duration |
存储笔记中的图片、视频等媒体文件的详细信息。 |
note_tag (笔记标签关联表) |
note_id, tag_id |
关联笔记和其所属的话题标签,是内容分类和推荐的重要依据。 |
dim_live (直播间维度表) |
live_id, user_id, title, start_time, end_time, live_status, viewer_count_peak |
存储直播间的核心信息。 |
商品/电商中心表
| 表名 (示例) | 核心字段 | 字段说明 |
|---|---|---|
dim_product (商品维度表) |
product_id, product_name, brand_id, category_id, price, original_price, image_url, detail_url, spu_id, sku_id |
存储商品的基础信息。spu_id (标准产品单元) 和 sku_id (库存单位) 是电商领域的核心概念。 |
note_product_relation (笔记-商品关联表) |
relation_id, note_id, product_id, position |
核心关联表,记录笔记中挂载了哪些商品,以及商品在笔记中的位置(如第几张图),这是“种草”到“拔草”链路的关键。 |
dim_order (订单维度表) |
order_id, user_id, order_status, total_amount, payment_amount, create_time, payment_time, logistics_company, tracking_number |
存储订单的核心信息,反映交易状态。 |
dim_order_item (订单明细表) |
item_id, order_id, product_id, sku_id, quantity, item_price |
存储订单中具体购买的商品信息,一笔订单可以包含多个商品。 |
互动行为表
这个模块的数据通常存储在 user_behavior_log 中,但为了分析,会将其汇总到专门的表中。
| 表名 (示例) | 核心字段 | 字段说明 |
|---|---|---|
fact_note_interaction (笔记互动事实表) |
interaction_id, note_id, user_id, like_count, collect_count, comment_count, share_count, timestamp |
核心事实表,记录笔记的各项互动数据,用于衡量笔记的热度和影响力。 |
dim_comment (评论维度表) |
comment_id, note_id, user_id, content, parent_comment_id, create_time, is_deleted |
存储评论内容,支持多级评论(通过 parent_comment_id)。 |
推荐与搜索表
| 表名 (示例) | 核心字段 | 字段说明 |
|---|---|---|
user_embedding (用户向量表) |
user_id, embedding_vector |
存储用户兴趣的向量表示,用于召回阶段的个性化推荐。 |
item_embedding (内容向量表) |
note_id / product_id, embedding_vector |
存储笔记或商品的向量表示,用于计算与用户的相似度。 |
search_log (搜索日志表) |
search_id, user_id, query, clicked_note_ids, timestamp |
记录用户的搜索行为,用于优化搜索算法和发现热门搜索词。 |
recommend_log (推荐日志表) |
log_id, user_id, note_id_shown, position, is_clicked, is_liked, timestamp |
记录推荐流中给用户展示了哪些笔记,以及用户的后续反馈,用于评估和迭代推荐算法。 |
创作者与商业中心表
| 表名 (示例) | 核心字段 | 字段说明 |
|---|---|---|
dim_creator (创作者维度表) |
user_id, fans_count, note_count, avg_like_count, commercial_value_score, verification_status |
存储创作者的运营数据和价值评估。 |
dim_ad_campaign (广告活动表) |
campaign_id, advertiser_id, budget, start_time, end_time, targeting_tags |
存储品牌方投放的广告活动信息。 |
fact_ad_impression_click (广告展示点击事实表) |
log_id, campaign_id, user_id, note_id, impression_time, click_time, bid_amount |
记录广告的每一次展示和点击,是广告结算和效果分析的核心。 |
数据应用场景
这些数据表支撑了小红书方方面面的业务:
-
个性化推荐:
- 流程:
user_embedding+item_embedding-> 召回 -> 排序 ->recommend_log(反馈优化)。 - 目的: 在“发现”页和“搜索”页为用户精准推荐可能感兴趣的笔记和商品。
- 流程:
-
内容分析:
- 数据源:
dim_note,fact_note_interaction,dim_tag。 - 目的: 分析什么样的标题、封面、内容、标签更容易获得高互动;追踪热点话题和流行趋势。
- 数据源:
-
用户画像与分层:
- 数据源:
dim_user,user_profile,user_behavior_log,dim_order。 - 目的: 构建用户画像,识别高价值用户、潜在流失用户,并进行精细化运营和触达。
- 数据源:
-
电商与种草分析:
- 数据源:
note_product_relation,dim_order,dim_order_item。 - 目的: 分析“种草笔记”的转化效果,评估KOL/KOC的商业价值;优化选品和供应链。
- 数据源:
-
商业化变现:
- 数据源:
fact_ad_impression_click,dim_ad_campaign。 - 目的: 为广告主提供精准的广告投放和效果衡量报告,实现平台收入。
- 数据源:
-
社区安全与风控:
- 数据源:
user_behavior_log,dim_note,dim_comment。 - 目的: 通过用户行为和内容特征,识别并处理垃圾广告、虚假种草、违规内容等。
- 数据源:
小红书的数据表是一个庞大且复杂的体系,但其核心逻辑非常清晰:
- 以用户为中心,记录所有行为。
- 为核心,连接人与商品。
- 通过丰富的标签和向量,实现精准的个性化。
- 通过事实表记录互动和交易,量化一切业务的价值。
理解了这些表之间的关系,你就能基本掌握小红书的数据脉络,并能基于此进行各种深度分析。
文章版权及转载声明
作者:99ANYc3cd6本文地址:https://www.chumoping.net/post/14285.html发布于 昨天
文章转载或复制请以超链接形式并注明出处初梦运营网


