本文作者:99ANYc3cd6

关于小红书的数据表,这份表格具体包含哪些核心数据维度?如何通过数据洞察用户行为与平台趋势?

99ANYc3cd6 昨天 2
关于小红书的数据表,这份表格具体包含哪些核心数据维度?如何通过数据洞察用户行为与平台趋势?摘要: 小红书作为一个以UGC(用户生成内容)为核心的社区电商平台,其数据表设计必然围绕“人、货、场”这三个核心要素展开,作为一个内容平台,本身也是独立且核心的一环,以下我将从核心业务模型...

小红书作为一个以UGC(用户生成内容)为核心的社区电商平台,其数据表设计必然围绕“人、货、场”这三个核心要素展开,作为一个内容平台,本身也是独立且核心的一环。

关于小红书的数据表,这份表格具体包含哪些核心数据维度?如何通过数据洞察用户行为与平台趋势?
(图片来源网络,侵删)

以下我将从核心业务模型、数据表分类、关键数据表详解、以及数据应用四个方面,为你系统地梳理小红书的数据表。


核心业务模型:人、货、场、内容

理解了小红书的商业模式,就能更好地理解其数据表的设计逻辑。

  • 人: 用户、创作者、品牌方、KOL/KOC。
  • 货: 商品、笔记、直播、视频。
  • 场: 平台、搜索、推荐流、直播间的场景。
  • 笔记、图文、视频、评论、点赞、收藏,这是连接“人”和“货”的桥梁。

所有数据表的设计都是为了记录和分析这四者之间的互动关系。


数据表分类

小红书的数据表可以大致分为以下几个核心模块:

关于小红书的数据表,这份表格具体包含哪些核心数据维度?如何通过数据洞察用户行为与平台趋势?
(图片来源网络,侵删)
  1. 用户中心表: 存储用户的基本信息、行为和画像。
  2. 内容中心表: 存储笔记、视频、直播等核心内容数据。
  3. 商品/电商中心表: 存储商品信息、交易数据、订单信息。
  4. 互动行为表: 记录用户与内容、商品之间的所有互动行为。
  5. 推荐与搜索表: 存储用户偏好、标签、以及推荐/搜索日志。
  6. 创作者与商业中心表: 针对创作者和品牌方的数据,如收益、广告投放等。

关键数据表详解

下面我们逐一展开每个模块下的核心数据表。

用户中心表

表名 (示例) 核心字段 字段说明
dim_user (用户维度表) user_id, nickname, avatar_url, gender, age, city, register_time, last_login_time, user_level, user_type 存储用户的基础静态信息。user_type 可区分普通用户、创作者、品牌等。
user_profile (用户画像表) user_id, interest_tags, fashion_style, skin_tone, beauty_concern, following_topics 存储基于用户行为分析得出的动态标签和画像,用于个性化推荐。
user_behavior_log (用户行为日志表) log_id, user_id, behavior_type, target_id, target_type, timestamp, device_info, ip_address 核心行为表,记录用户的一切行为,如浏览、点击、搜索、分享等。behavior_type 是关键,target_type 区分行为对象是笔记、商品还是用户。

内容中心表

表名 (示例) 核心字段 字段说明
dim_note (笔记维度表) note_id, user_id, title, content, cover_image_url, create_time, update_time, note_status, note_type 存储笔记的核心元数据。note_status 可标记为正常、删除、隐藏等。note_type 可标记为图文、视频、直播回放等。
note_media (笔记媒体资源表) media_id, note_id, media_url, media_type, width, height, duration 存储笔记中的图片、视频等媒体文件的详细信息。
note_tag (笔记标签关联表) note_id, tag_id 关联笔记和其所属的话题标签,是内容分类和推荐的重要依据。
dim_live (直播间维度表) live_id, user_id, title, start_time, end_time, live_status, viewer_count_peak 存储直播间的核心信息。

商品/电商中心表

表名 (示例) 核心字段 字段说明
dim_product (商品维度表) product_id, product_name, brand_id, category_id, price, original_price, image_url, detail_url, spu_id, sku_id 存储商品的基础信息。spu_id (标准产品单元) 和 sku_id (库存单位) 是电商领域的核心概念。
note_product_relation (笔记-商品关联表) relation_id, note_id, product_id, position 核心关联表,记录笔记中挂载了哪些商品,以及商品在笔记中的位置(如第几张图),这是“种草”到“拔草”链路的关键。
dim_order (订单维度表) order_id, user_id, order_status, total_amount, payment_amount, create_time, payment_time, logistics_company, tracking_number 存储订单的核心信息,反映交易状态。
dim_order_item (订单明细表) item_id, order_id, product_id, sku_id, quantity, item_price 存储订单中具体购买的商品信息,一笔订单可以包含多个商品。

互动行为表

这个模块的数据通常存储在 user_behavior_log 中,但为了分析,会将其汇总到专门的表中。

表名 (示例) 核心字段 字段说明
fact_note_interaction (笔记互动事实表) interaction_id, note_id, user_id, like_count, collect_count, comment_count, share_count, timestamp 核心事实表,记录笔记的各项互动数据,用于衡量笔记的热度和影响力。
dim_comment (评论维度表) comment_id, note_id, user_id, content, parent_comment_id, create_time, is_deleted 存储评论内容,支持多级评论(通过 parent_comment_id)。

推荐与搜索表

表名 (示例) 核心字段 字段说明
user_embedding (用户向量表) user_id, embedding_vector 存储用户兴趣的向量表示,用于召回阶段的个性化推荐。
item_embedding (内容向量表) note_id / product_id, embedding_vector 存储笔记或商品的向量表示,用于计算与用户的相似度。
search_log (搜索日志表) search_id, user_id, query, clicked_note_ids, timestamp 记录用户的搜索行为,用于优化搜索算法和发现热门搜索词。
recommend_log (推荐日志表) log_id, user_id, note_id_shown, position, is_clicked, is_liked, timestamp 记录推荐流中给用户展示了哪些笔记,以及用户的后续反馈,用于评估和迭代推荐算法。

创作者与商业中心表

表名 (示例) 核心字段 字段说明
dim_creator (创作者维度表) user_id, fans_count, note_count, avg_like_count, commercial_value_score, verification_status 存储创作者的运营数据和价值评估。
dim_ad_campaign (广告活动表) campaign_id, advertiser_id, budget, start_time, end_time, targeting_tags 存储品牌方投放的广告活动信息。
fact_ad_impression_click (广告展示点击事实表) log_id, campaign_id, user_id, note_id, impression_time, click_time, bid_amount 记录广告的每一次展示和点击,是广告结算和效果分析的核心。

数据应用场景

这些数据表支撑了小红书方方面面的业务:

  1. 个性化推荐:

    • 流程: user_embedding + item_embedding -> 召回 -> 排序 -> recommend_log (反馈优化)。
    • 目的: 在“发现”页和“搜索”页为用户精准推荐可能感兴趣的笔记和商品。
  2. 内容分析:

    • 数据源: dim_note, fact_note_interaction, dim_tag
    • 目的: 分析什么样的标题、封面、内容、标签更容易获得高互动;追踪热点话题和流行趋势。
  3. 用户画像与分层:

    • 数据源: dim_user, user_profile, user_behavior_log, dim_order
    • 目的: 构建用户画像,识别高价值用户、潜在流失用户,并进行精细化运营和触达。
  4. 电商与种草分析:

    • 数据源: note_product_relation, dim_order, dim_order_item
    • 目的: 分析“种草笔记”的转化效果,评估KOL/KOC的商业价值;优化选品和供应链。
  5. 商业化变现:

    • 数据源: fact_ad_impression_click, dim_ad_campaign
    • 目的: 为广告主提供精准的广告投放和效果衡量报告,实现平台收入。
  6. 社区安全与风控:

    • 数据源: user_behavior_log, dim_note, dim_comment
    • 目的: 通过用户行为和内容特征,识别并处理垃圾广告、虚假种草、违规内容等。

小红书的数据表是一个庞大且复杂的体系,但其核心逻辑非常清晰:

  • 以用户为中心,记录所有行为。
  • 为核心,连接人与商品。
  • 通过丰富的标签和向量,实现精准的个性化。
  • 通过事实表记录互动和交易,量化一切业务的价值。

理解了这些表之间的关系,你就能基本掌握小红书的数据脉络,并能基于此进行各种深度分析。

文章版权及转载声明

作者:99ANYc3cd6本文地址:https://www.chumoping.net/post/14285.html发布于 昨天
文章转载或复制请以超链接形式并注明出处初梦运营网

阅读
分享