自动化监控 Twitter 关键词

这件事情我本来想作为第三个莽撞人项目的，但昨天操起键盘开了个头，然后不小心就给做完了。

事情是这样：有时候我想看看某些关键词在 Twitter 上的讨论，但我又不想费劲每次都去搜索，因为头一天搜和第二天搜的结果可能是一样的，这期间没有人讨论它。比如最近有没有人狠狠表扬我之类的。思路和工具链如下：

用户提供一个关键词向量。
用 rtweet 包去搜索（search_tweets() 函数）。

数据有了之后，把数据按天汇总转化为 Markdown 文件。比如

---
title: "Messages on 2017/04/11"
date: "2017/04/11"
---

# bookdown

> Author1, [Message1](Link1), ExtraInfo1

> Author2, [Message2](Link2), ExtraInfo2

> ...

# blogdown

...

Markdown 文件按日期命名，如 2017-04-11.md。
在 GitHub 上建一个简单的 Hugo 网站库，在 Travis 上运行上面的 R 代码，把 Markdown 文件写入 content/post/ 文件夹，再推回到 GitHub 库里。
把 GitHub 跟 Netlify 连起来。每当 GitHub 库有更新，Netlify 自动重新编译网站。
Travis 有一项新功能尚在测试中，就是周期任务（cron），也就是可以定义每过多久重新跑一遍 Travis 脚本。比如可以定义每天跑一遍。这样我就不必每天亲自去 Twitter 上看消息了，只需要订阅我自己的 RSS 种子，通过 RSS 阅读器看就够了。节省了我好几分钟时间。

最后的成品在 GitHub 库 twitter-blogdown 中。可以看见 R 代码并不长，才 40 行，但这整个问题的难点在于工具链。每个单个的工具都不复杂，就是需要在脑子里能把它们都串联起来，还需要看每个工具的相关文档，比如 Twitter REST API（例如为什么要用 since_id 参数）和 Travis 的周期任务文档，还要知道基本的 Hugo 网站怎么搭建、Netlify 跟 GitHub怎么连、用 GitHub 的个人访问令牌（Personal Access Token）如何向 GitHub 库推送内容、域名怎么设置。

这种组装感觉就像 UNIX 命令的管道组装一样，每个命令做什么都很清楚，掌握单个命令的用处很有限，但把这一条条神龙召唤到一起，就能引发 lollapalooza 效应。

好了，下面轮到莽撞人出场了。Twitter 的我做了，渣浪微博有没有戏？

赞赏

作为一名没有固定工作的自由职业者，我非常感谢您通过捐赠的方式来支持我的写作和开源软件开发。当然，捐赠纯属自愿。无论金额多少，都是一片诚挚的心意。支付方式如下：

微信	← 奋力支开它俩 →	支付宝
	其它爱心通道 ↓ Venmo: `@yihui_xie` Zelle: `[email protected]` PayPal: `[email protected]`

若使用 Venmo/Zelle/Paypal，请添加备注“gift”或“donation”，以免捐赠被视为我的可税收入。若使用 Paypal，支付类型请选 Family and Friends，而不要选 Goods and Services。

在不影响生活的前提下，我会将收到的捐赠以尽量大的比例回馈给开源社区和慈善机构。作为参考，2024-25 年间我共收到约三万美元捐赠，完税后我转手捐出了一万五千美元。

谢益辉 2017-04-13