采集入库的章节最少字数限制 设置无效 已处理

魔蛋 2018-3-1 1026

后台

采集入库的章节最少字数限制 设置了 不起作用呢?

我限制少于1000字的不采集入库 好像是没有用,还是照样能采集

这个章节内容才290个字数  http://www.biquge.com.tw/10_10493/8968813.html ,采集还是能入库

最后于 2018-3-12 被三郎编辑 ,原因:
最新回复 (6)
  • 0 引用 2
    字数限制是把所有采集到的内容都计算在内的,不只是汉字,包括所有的字母、符号、空格等等。
    2018-3-2 回复
  • 0 引用 3
    三郎 字数限制是把所有采集到的内容都计算在内的,不只是汉字,包括所有的字母、符号、空格等等。
    三郎,不符合字数要求采集的章节是忽略掉还是停止这条采集规则?
    2018-3-7 回复
  • 0 引用 4
    看你后台的设置,你选忽略就直接入库,你选停止就停止
    2018-3-7 回复
  • 0 引用 5
    三郎 看你后台的设置,你选忽略就直接入库,你选停止就停止
    不管用的
    2018-3-8 回复
  • 0 引用 6
    魔蛋 不管用的

    你给出的那个页面内容字段已经超过9000字了,内容包括英文字母、符号等等

    最后于 2018-3-8 被三郎编辑 ,原因:
    2018-3-8 收起回复
    牧师: 判断的时候不过滤html标签吗?
    2018-3-20回复
    三郎: 回复 牧师: 目前会过滤<br>、<p>、以及空格,其他的标签应该尽量在采集时过滤掉
    2018-3-20回复
  • 0 引用 7
    最新的更新已经能够准确判断中英文字数。
    2018-3-12 回复
返回
发新帖