开源小红书抖音微博爬虫工具MediaCrawler深度解析

MediaCrawler是一款功能强大的开源爬虫工具,支持小红书、抖音、微博等多平台视频、图片、评论等数据的抓取。本文将详细介绍其功能、使用方法及数据保存方式。

3AI工具爬虫工具开源软件小红书抖音微博

MediaCrawler是什么

MediaCrawler是一款在线开源的小红书、抖音、微博爬虫工具,能够抓取这些平台上的视频、图片、评论、点赞、转发等信息。它利用playwright技术,通过保留登录后的浏览器环境,简化了加密参数的获取过程,降低了逆向难度,适合有一定技术基础的用户使用。

MediaCrawler-开源小红书抖音微博爬虫工具

MediaCrawler功能列表

查看功能截图

MediaCrawler如何使用

创建并激活python虚拟环境

cd MediaCrawler
python -m venv venv
source venv/bin/activate (macos & linux)
venv\Scripts\activate (windows)

安装依赖库

pip3 install -r requirements.txt

安装playwright浏览器驱动

playwright install

运行爬虫程序

python main.py --platform xhs --lt qrcode --type search
python main.py --platform xhs --lt qrcode --type detail
python main.py --help (查看其他平台爬虫使用示例)

数据保存

  • 支持保存到关系型数据库(Mysql、PgSQL等)
  • 支持保存到csv中(data/目录下)
  • 支持保存到json中(data/目录下)

开源小红书抖音微博爬虫工具

源码备份:国内网盘

MediaCrawler-开源小红书抖音微博爬虫工具

GitHub:https://github.com/NanmiCoder/MediaCrawler