Skip to main content

· 4 min read
Czasg

这是一场反爬与反反爬技术人员之间的斗争~

爬虫服务能够在网络上不知疲倦的获取信息,所以一般会带有某些易于常人的特征

反爬则基于这些特征进行拦截,而反反爬有两个思路:
1、消除爬虫特征,使得自己像正常人一样。比如降低爬取频率就是一个不错的方案~
2、破解反爬技术,即使被识别仍然可以获取

在反反爬的技术领域,有这么一类偏方,就是自动化。
它完全模拟常人操作,从而达到"一力破万法"的效果。

· One min read
Czasg

语言的本质是对思维的表达,只有把某个事务的脉络理清了,才能想清楚,讲清楚。

整理下结构化思考中捋清事务脉络的方式。

· 2 min read
Czasg

在一次线上运维过程中,发现最新的数据,排在了前几天之后。

因为列表是按主键排序的,所以显示是没有问题的。

问题就在于,为什么最新的数据,主键会小于前几天的数据。

· 2 min read
Czasg

背景是有个需求需要下载文件并计算此文件的MD5。

然后同事开发的(Go)程序是先创建一个文件,然后写入下载数据。再没有关闭文件的前提下,重新又开启了一个新的文件流来计算MD5。

由此引发了一些争执...

· 2 min read
Czasg

Iaas: Infrastructure as a Service 基础设施即服务

Paas: Platform as a service 平台即服务

Saas: Software as a service 软件即服务

· One min read
Czasg
SELECT
proname
FROM
pg_proc
WHERE
prosrc LIKE'%table_name%';