搭建一个小说站点的采集器,网上找的下载的各种教程,都没成功启动。最后总结成功启动的教程,下一步学习采集规则编写。

安装Python3.8.5

apt install sudo
sudo apt update
sudo apt install build-essential zlib1g-dev libncurses5-dev libgdbm-dev libnss3-dev libssl-dev libsqlite3-dev libreadline-dev libffi-dev curl libbz2-dev curl -y
  • 下载Python-3.8.5

curl -O https://www.python.org/ftp/python/3.8.5/Python-3.8.5.tar.xz
  • 解压Python-3.8.5

tar -xf Python-3.8.5.tar.xz
  • 进入安装目录

cd Python-3.8.5/
  • 设置编译参数

./configure --prefix=/usr/local/python3.8.5 --enable-optimizations
  • 编译及安装

make -j 12 && sudo make altinstall
  • 查看版本,确定输出的版本是3.8.x就可以了

python3.8 -V

安装94采集器

  • 先宝塔面板安装Supervisor(软件商店搜索)

  • 进入SSH开始安装94采集器,进入www目录。

cd /www
wget https://wenjian.me/t/tools.tar.gz
  • 解压94采集器

tar -xf tools.tar.gz
  • 进入tools文件夹

cd tools
  • 切换到www用户创建虚拟环境

#切换到www用户
su www
#建虚拟环境
python3.8 -m venv .venv
  • 激活虚拟环境

source .venv/bin/activate
  • 安装依

pip install -r requirements.txt
pip install pyppeteer==0.2.6

  • 运行采集器,输出这样结果就是可以了。

python index.py

重新启动采集器并守护进程

  • 先ctrl+c结束结束运行的采集器。

lsof -i :8910  #获取PID
kill -9 1234  # 123替换为实际的 PID

  • 重新运行采集器并添加守护

  • 切记一定要启动命令一定要这个。

/www/tools/.venv/bin/python index.py

注意事项:

  • 最后登录地址是IP:8910,登录的账号密码可以在目录文件里面的config里面查看。安装结束了,下一步自学采集规则的编写,慢慢搞不着急。