获取新闻并转换为纯文本 php

Get news and convert to plain text php

我想知道是否有办法从新闻网站中随机选择 link,获取页面并删除除文本以外的所有内容以使用 php cli 存储在数据库中。就 php 扩展而言,我对可以安装的内容没有限制。如果没有简单的方法来做到这一点,是否有提供纯文本新闻的新闻服务?

谢谢。

不 - 不是来自 'website'... html 因站点而异,而且过于复杂,无法从一个来源过滤 - 添加多个来源,任务是不可能的。

这是个坏消息。好消息是有办法:

大多数 "news" 站点在 RSS 提要中提供其内容或部分内容。对 RSS2ATOM 协议做一些研究,你的答案就在那里...

从这里开始:http://www.whatisrss.com