首页 > 解决方案 > 计算字符串段落质量的最佳方法?

问题描述

我有一个 cron 作业,每天搜索一次 WordPress 帖子,找到所有带有>5000帖子字符的帖子,并将其分配给“高质量”类别。

但是我想改进这个系统并实际判断帖子内容本身。例如,有人可以只发布 youtube 链接或垃圾内容以达到限制,然后将其分配到类别。

PHP中是否有确定变量中字符串内容质量的好方法?

我可能对它很基本,并且很难计算 youtube 链接来确定它,但我想尽可能彻底。

编辑:就这个场景中“高质量”的含义而言,它是一个游戏王牌组建造场所,用户可以发布牌组以及牌组描述/指南。这是一个例子:https ://ygoprodeck.com/shiranui-demon-slayers-of-zombie-world/

目前对 >5000 个字符的测试已经奏效(在这种情况下,这意味着他们写了一个指南/良好的描述),但这不会阻止一个只有 YouTube 链接的帖子或有人按住“A”键直到他们达到 5000。

标签: php

解决方案


推荐阅读