防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法
1
FrankFang128 2015-06-11 08:14:40 +08:00 via Android
把内容写在CSS里,使用你自己特制的字体,比如『我』的Unicode 码对应你
|
2
myleon 2015-06-11 08:19:08 +08:00
加干扰码或者异步加载内容,不过不管怎么防止采集对搜索引擎都不友好
|
3
banri 2015-06-11 08:29:22 +08:00 via iPhone
直接来源不就行了,妈妈再也不用担心被采集啦!
说真的都写前端了,就不要担心扒皮的事儿,因为100%可以被扒皮啊… |
4
banri 2015-06-11 08:29:39 +08:00 via iPhone
:D 打错了是开源
|
5
kisshere 2015-06-11 08:46:29 +08:00 via Android
全部用js生成模板
|
6
binux 2015-06-11 08:51:32 +08:00 via Android
没有办法
|
7
lwbjing 2015-06-11 08:51:37 +08:00
canvas重绘。。
|
8
endoffight 2015-06-11 08:59:42 +08:00
js模板 selenium直接秒杀
|
9
typcn 2015-06-11 09:01:23 +08:00
修改 nginx 配置,listen 80 改成 listen 127.0.0.1:80
|
11
learnshare 2015-06-11 09:38:35 +08:00 1
后端直接渲染成图片
|
12
seerhut 2015-06-11 09:43:41 +08:00
只要字体规整,图片也能高效ocr....
|
13
gangsta 2015-06-11 09:46:51 +08:00
|
14
Havee 2015-06-11 09:50:17 +08:00
不可能,综上
|
15
onlyice 2015-06-11 09:52:25 +08:00 via Android
Canvas....
|
16
johnsmith123 2015-06-11 09:55:22 +08:00
怎么防止我发到网上的东西不会被复制?
|
17
liujiantao 2015-06-11 10:10:11 +08:00 via Android
看看我这个 /t/157243
|
18
kokdemo 2015-06-11 10:10:33 +08:00
……我觉得这只是增加了采集的门槛
但是也够了 |
19
thankyourtender 2015-06-11 10:14:06 +08:00
日他,正面刚他,
|
20
Andy1999 2015-06-11 10:16:43 +08:00 via iPhone
屏蔽外部IP
|
22
mcone 2015-06-11 11:36:21 +08:00
没办法 很难
百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的 |
24
amxku 2015-06-11 23:22:57 +08:00
其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做
|