基于大规模 Steam 游戏数据的交互式分析与图推荐展示
基于 Kaggle Steam Games Dataset 2025(89,618 款游戏、452 个标签、33 个类型),
对 Steam 游戏市场进行结构分析、玩家反馈挖掘与标签生态定位,
并将游戏、标签、类型、分类抽象为异构图结构,实现基于图相似度的游戏推荐。
GitHub: TobyKSKGD/Ultimate_Game_Insights
基于 March 2025 Steam 数据集(89,618 款游戏)的趋势分析。
数据截止至 2025 年 3 月,2025 年仅包含前三个月的发行记录,不反映全年数据。
展示 Top 标签和类型的中位好评率与评论数,反映玩家关注度分布。
基于游戏描述文本与标签体系的非结构化数据分析,揭示不同热度层级的游戏在词汇选择与市场定位上的差异。
比较评论数≥100与<100的游戏描述中哪些词最具区分力。高评论组词汇偏向大型/多人/叙事,低评论组词汇偏向休闲/解谜/简单。
标签数量越多,中位好评率整体越高(r≈0.28)。更多标签可能意味着更精准的搜索曝光和更清晰的市场定位。
将游戏、标签、类型、分类抽象为异构图结构:
Game —has_tag→ Tag |
Game —has_genre→ Genre |
Game —has_category→ Category
节点大小 = 出现该标签的游戏数量,边粗细 = 共现次数。仅显示权重最高的 200 条边。
| 标签 A | 标签 B | 共现次数 |
|---|