nginx反爬虫配置_服务器-免费资源网

时间：2023-02-09

阅读：

新建文件agent_deny.conf，添加一下内容：

#禁止Scrapy等工具的抓取
if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
     return 403;
}
#禁止指定UA及UA为空的访问
if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|^$" ) {
     return 403;             
}
#禁止非GET|HEAD|POST方式的抓取
if ($request_method !~ ^(GET|HEAD|POST)$) {
    return 403;
}

修改Nginx配置文件，在需要处理的server中包含该文件，include agent_deny.conf（注意路径）

附上常见的爬虫UA，这个是在github上找到别人整理好的，还支持验证，大叫有兴趣的话可以自己去看看

部分UA：

"Googlebot/2.1 (+http://www.google.com/bot.html)"
"Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
"Mozilla/5.0 (iPhone; CPU iPhone OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5376e Safari/8536.25 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
"Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/537.36 (KHTML, like Gecko) Version/8.0 Mobile/12F70 Safari/600.1.4 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
"Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12F70 Safari/600.1.4 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
"Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
"Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
"Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Safari/537.36"

丢失数据的本质在本文开始前，首先明白一个点，平时我们说的组件数据不丢失究竟是在指什么，如果你往ES写入数据，ES返回给你写入错误，这个不算数据丢失。如果你往ES写入数据，ES返回给

2024-03-13 00:00:59

引言在网络环境中，有时候我们需要让局域网内的电脑访问外网，但是由于网络策略或其他原因，直接访问外网是不可行的。这时候，可以借助 Nginx 来搭建一个正向代理服务器，实现局域网

2024-03-12 23:58:37

netcat 命令介绍及使用示例nc（netcat）是一个强大的网络工具，它可以用于读取和写入数据流，支持 TCP 和 UDP 协议。它常被用于网络调试和网络服务的创建。一、安装方法centos 中，执

2024-03-08 22:33:26

接触过 Linux 的小伙伴们都知道在 Linux （或者说类 Unix）中，有三种类型的用户：超级用户（UID 为 0）：即 root 用户，拥有最高权限。系统用户（UID 为 1~999）：系统内建用户，用于运行系统服

2024-03-01 20:34:50

1 背景说明在做系统集群部署时,涉及到两个或多个服务器之间文件同步.在软件层面linux服务环境找到以下两种同步方式利用linux NFS功能将网络共享文件挂载成本地目录采用文

2024-03-01 11:54:51

这篇文章主要介绍了 Docker 如何利用 Linux 的 Control Groups（cgroups）实现容器的资源隔离和管理。最后通过简单 Demo 演示了如何使用 Go 和 cgroups 交互。如果你对云原生技

2024-02-26 22:19:08

通过这篇文章你可以了解到 Docker 容器的核心实现原理，包括 Namespace、Cgroups、Rootfs 等三个核心功能。如果你对云原生技术充满好奇，想要深入了解更多相关的文章和资讯，欢迎

2024-02-26 22:18:00

本文为从零开始写 Docker 系列第二篇，主要在 mydocker run 命令基础上优化参数传递方式，改为使用 runC 同款的匿名管道传递参数。完整代码见：https://github.com/lixd/mydocker

2024-02-26 22:17:36

本文为从零开始写 Docker 系列第一篇，主要实现 mydocker run 命令，构造了一个具有基本的 Namespace 隔离的简单容器。如果你对云原生技术充满好奇，想要深入了解更多相关的文章

2024-02-26 22:17:04

哈喽大家好，我是咸鱼。之前写过两篇关于 SSL 过期巡检脚本的文章： SSL 证书过期巡检脚本 SSL 证书过期巡检脚本(Python 版)这两篇文章都是讲如何通过脚本去自动检测 SSL 过期

2024-02-26 22:09:11

why 为什么要搭建此开发环境? 在linux环境下开发可以利用shell命令实现对文件的批处理伟大的程序员应该都用类unix系统! 可以实现对底层编译技术的了解,以便于更好的掌握嵌

2024-02-07 19:09:41

简介Nginx是一个高性能的HTTP和反向代理web服务器，同时也提供了IMAP/POP3/SMTP服务。其特点是占有内存少，并发能力强，在同类型的网页服务器中表现较好。此外，Nginx也可以作为一

2024-01-30 20:44:23

虚拟主机是一种特殊的软硬件技术，它可以将网络上的每一台计算机分成多个虚拟主机，每个虚拟主机可以独立对外提供www服务，这样就可以实现一台主机对外提供多个web服务，每个虚拟主

2024-01-30 20:43:52

nginx进程结构linux 信号量管理机制[root@VM-8-17-centos nginx]# kill -l 1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP 6) SIGABRT

2024-01-30 20:42:44

本站的环境搭建用的军哥的 LNMP PHP 版本是 7.3.33 想用 PHP 8.0 但是有些客观的原因存在暂时无法使用。今天事情不多就把 LNMP PHP 的版本升级一下，把 PHP 升级到 7.4.29 如

2024-01-28 21:29:42

在我内网的 HomeLab 上部署 NextCloud 测试用。在部署的过程中需要用到 PHP 的 smbclient 这个扩展，就是在 NextCloud 上挂载我群晖的 SMB 共享作为存储。已经部署了 LNMP 环

2024-01-28 21:27:59

本篇教程是教大家如何使用群晖的 Active Backup for Business 套件来备份网站已经打包的压缩文件或者其他文件。无论你的网站环境是 LNMP 还是使用的宝塔，都可以使用这个教程

2024-01-28 21:23:05

Kickstart 是什么？kickstart是一个定义了Linux安装过程的配置文件，比如要在系统中使用的时区、如何对驱动器进行分区、或者应该安装哪些软件包。有了这个文件可以解放双手，让Li

2024-01-28 21:21:48

LNMP 的网站备份是压缩格式，但是数据库不是压缩格式。今天这篇文章是教大家如何让数据库备份为压缩格式。此方法来源于 LNMP 官方论坛。有需要的童鞋可以照着修改就可以了。

2024-01-28 21:21:00

Linux Shell 脚本入门教程Linux Shell 脚本是一种强大的工具，它允许您自动化日常任务和复杂操作。在本教程中，我们将逐步介绍几个实用的 Shell 脚本示例。每个示例都将详细说

2024-01-28 15:48:16

Linux操作系统具有多种安全策略，以下是其中一些常见的安全策略：访问控制：使用权限和访问控制列表（ACL）来限制用户对文件和目录的访问权限。可以使用chmod、chown等命令来设置文

2024-01-24 15:28:17

公司的一个商城项目，然后配置完参数，本来应该可以跑起来的，最近做了一次服务器迁移，打开后台发现浏览器提示重定向次数过多追踪代码调试，发现是$_SERVER['PHP_SELF']的值

2024-01-24 15:28:04

分布式架构是一种将系统拆分为多个独立的组件或服务，并在不同的计算节点上部署这些组件或服务的架构方式。它可以提供高性能和可用性的好处。下面我将详细介绍分布式架构在高

2024-01-24 15:27:42

将服务从 HTTP 变为 HTTPS，需要进行 SSL 证书的配置。需要完成一下步骤：获取 SSL 证书安装 SSL 证书配置 Nginx 支持 HTTPS 重启 Nginx HTTP 到 HTTPS 的重定向（可选）1. 获取

2024-01-24 15:27:26

总结/朱季谦在日常开发或者编程当中，经常需要用到redis集群，若是按照传统的方式，一个机器一个机器搭建，难免过于繁琐，故而可以通过dock er-compose编排方式，快速搭建。我在搭建过

2024-01-24 15:26:59

转载请注明出处：香吧香　　EOF（End of File）在Shell中通常用于指示输入的结束，并在脚本或命令中进行多行输入。它允许用户指定一个特定的分界符来表示输入的结束，通常用于创建临

2024-01-24 15:26:27

Prometheus 是一个时序数据库，存数据exporter是收集器，来收集被监控的数据，想要监控不同的内容，就使用不同的exporter，这个exporter应该放在被测服务器上，再把exporter和Prometheu

2024-01-24 15:25:59

公众号「架构成长指南」，专注于生产实践、云原生、分布式系统、大数据技术分享前言K8s本身不包含内置的监控工具，所以市场上有不少这样监控工具来填补这一空白，但是没有一个监

2024-01-24 15:25:39

在深入理解 Docker 核心原理：Namespace、Cgroups 和 Rootfs 一文中我们分析了 Docker 是由三大核心技术实现的。今天就一起分析 Docker 三大核心技术之一的 Linux Namespace

2024-01-24 15:25:18

前言linux以及嵌入式一些代码，我们看到core_initcall、device_initcall等等需要链接器分配各个section，并且在启动该模块时候执行。下面我们详细追溯一下执行过程。作者：良知犹

2024-01-24 15:24:55

2020-07-31

2019-11-21

2019-08-07

2018-09-24

2020-03-22

2019-02-16

2019-11-17

2018-10-07

2018-10-04

nginx反爬虫配置

Elasticsearch 如何保证写入过程中不丢失数据的

利用Nginx正向代理实现局域网电脑访问外网

netcat 命令介绍及使用示例

一行命令找出 Linux 中所有真实用户

linux服务器文件实时同步

Docker 与 Linux Cgroups：资源隔离的魔法之旅

深入理解 Docker 核心原理：Namespace、Cgroups 和 Rootfs

从零开始写 Docker(二)---优化：使用匿名管道传递参数

从零开始写 Docker(一)---实现 mydocker run 命令

通过 saltstack 批量更新 SSL 证书

linux下进行MCU开发环境搭建

Nginx系列：简介和安装（基于yum和源码的方式）

Nginx系列：虚拟主机配置（IP、端口、域名）三种配置方式

Nginx系列：详解进程结构和热部署

LNMP PHP 版本升级教程

LNMP PHP 添加 smbclient 扩展

群晖自动备份网站或服务器文件

CentOS7 使用 kickstart 批量安装操作系统

LNMP 数据库备份修改为压缩备份

你不知道的Linux shell操作

Linux有哪些安全策略

解决在nginx+php环境下$_SERVER['PHP_SELF']获取不到值的问题

分布式架构的高性能与可用性

Nginx 下将 http 改为 https

Docker部署系列之Docker Compose安装Redis三主三从集群

shell中 << EOF 和 EOF 使用

性能集成监控系统exporter+Prometheus+Grafana

在k8s中快速搭建基于Prometheus监控系统

探索 Linux Namespace：Docker 隔离的神奇背后

linux内核initcall放置在各个section中函数执行流程

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道