php - 计算字符串段落质量的最佳方法?
问题描述
我有一个 cron 作业,每天搜索一次 WordPress 帖子,找到所有带有>5000
帖子字符的帖子,并将其分配给“高质量”类别。
但是我想改进这个系统并实际判断帖子内容本身。例如,有人可以只发布 youtube 链接或垃圾内容以达到限制,然后将其分配到类别。
PHP中是否有确定变量中字符串内容质量的好方法?
我可能对它很基本,并且很难计算 youtube 链接来确定它,但我想尽可能彻底。
编辑:就这个场景中“高质量”的含义而言,它是一个游戏王牌组建造场所,用户可以发布牌组以及牌组描述/指南。这是一个例子:https ://ygoprodeck.com/shiranui-demon-slayers-of-zombie-world/
目前对 >5000 个字符的测试已经奏效(在这种情况下,这意味着他们写了一个指南/良好的描述),但这不会阻止一个只有 YouTube 链接的帖子或有人按住“A”键直到他们达到 5000。
解决方案
推荐阅读
- amazon-web-services - RHat企业服务器7.7 EC2镜像突然关闭80端口
- javascript - reactjs如何恢复到之前的状态?
- javascript - 如何在Javascript中将问号包围的文本提取到数组中
- python - 如何使用 Azure API 检测情绪?
- excel - 将 Excel 工作表转换为 paradox DB
- reactjs - 离子反应中的网络工作者
- python - Spark dataFrame在更新其列后显示时间过长
- android - 如何在android中的AWS复制操作中获取复制操作的进度?
- android - Android CTS 不运行
- mysql - 我如何获得电影十年的高度排名?