云码酷 发表于 2024-12-1 13:15:13

Centos8使用脚本安装结巴(jieba)分词




有时脚本是在Windows系统下编写的(使用CRLF换行符),但需要在Linux系统下运行(需要LF换行符)。

可以创建脚本文件,使用正确的Linux换行符。在服务器上直接执行以下命令来创建脚本:

注意: 将脚本中的目录路径改为自己的目录路径

脚本文件:

cat > /www/wwwroot/WordPress/install.sh << 'EOL'

#!/bin/bash



# 设置错误时退出

set -e



echo "开始安装结巴分词环境..."



# 检查是否为root用户

if [ "$(id -u)" != "0" ]; then

   echo "此脚本需要root权限运行"

   exit 1

fi



# 清理旧的结巴分词安装

echo "===== 清理旧的安装 ====="

pip3 uninstall -y jieba || true

rm -rf /usr/local/python3/lib/python3*/site-packages/jieba*

rm -rf /usr/lib64/python3*/site-packages/jieba*



# 确保基础工具已安装

echo "===== 安装基础依赖 ====="

dnf install -y python3 python3-pip python3-devel gcc



# 升级pip

echo "===== 升级pip ====="

python3 -m pip install --upgrade pip



# 安装结巴分词

echo "===== 安装结巴分词 ====="

pip3 install --no-cache-dir jieba



# 验证安装

echo "===== 验证安装 ====="

if python3 -c "import jieba; print('结巴分词版本:', jieba.__version__)" ; then

    echo "结巴分词安装成功!"

else

    echo "结巴分词安装失败,请检查错误信息"

    exit 1

fi



# 创建测试脚本

echo "===== 创建测试脚本 ====="

cat > /www/wwwroot/WordPress/jieba_test.py << 'EOF'

#!/usr/bin/env python3

# -*- coding: utf-8 -*-



import jieba



test_str = "结巴分词测试句子"

seg_list = jieba.cut(test_str, cut_all=False)

print("精确模式: " + "/ ".join(seg_list))

EOF



chmod +x /www/wwwroot/WordPress/jieba_test.py



echo "===== 运行测试 ====="

python3 /www/wwwroot/WordPress/jieba_test.py



echo "

安装完成!

你可以运行以下命令测试分词功能:

python3 /www/wwwroot/WordPress/jieba_test.py

"

EOL



然后给脚本添加执行权限:
chmod +x /www/wwwroot/WordPress/install.sh

现在可以运行安装脚本:
bash /www/wwwroot/WordPress/install.sh



fbmqyv 发表于 2024-12-1 13:15:13

没人回帖。。。我来个吧

trkwwr 发表于 2024-12-1 13:26:37

路过

xumv 发表于 2024-12-1 13:37:00

OMG!介是啥东东!!!

uy41u 发表于 2024-12-1 13:47:28

纯粹路过,没任何兴趣,仅仅是看在老用户份上回复一下

2on 发表于 2024-12-1 13:58:00

有空一起交流一下

rwz2fp 发表于 2024-12-1 14:08:28

为了三千积分!

de40hl 发表于 2024-12-1 14:18:40

好帖必须得顶起

_ci 发表于 2024-12-1 14:29:32

锄禾日当午,发帖真辛苦。谁知坛中餐,帖帖皆辛苦!

oodzh 发表于 2024-12-1 14:40:16

LZ是天才,坚定完毕
页: [1] 2
查看完整版本: Centos8使用脚本安装结巴(jieba)分词