环境部署
- 环境中安装python2.7.12以上版本Python。
- 数据库需要开启对PL/Python存储过程的支持。
- 安装算法库需要拥有管理员权限的用户。
操作步骤
编译部署数据库。
其他编译保持步骤不变;
编译完成后,需要重新gs_initdb;
默认PL/Python存储过程模块不被加载,请执行“CREATE EXTENSION plpythonu”来加载模块。
算法库编译和安装。
算法库使用开源的MADlib机器学习框架。源码包和相应patch可以从第三方库的代码仓库里获取。安装命令如下:
其中, {YOUR_MADLIB_INSTALL_FOLDER}需要改为用户的实际安装路径。
将算法库安装到数据库中。
- 进入 bin文件夹。
执行如下命令。
命令中参数说明如下:
- -s:schema的名称。
- -p:数据库平台,使用opengauss即可。
- -c:连接数据库的参数。包括用户名、‘@’、IP地址、端口号和目标数据库名称。
说明: - 目标数据库必须存在。 - IP请使用127.0.0.1,不要使用localhost。 - 涉及到大量PL/Python存储过程的安装、卸载等操作,需要数据库管理员权限用户来进行,普通用户没有权限创建和修改PL/Python存储过程,只能调用。 - 数据库兼容性,推荐兼容性为B。不同的数据库兼容性下,对空值,NULL等处理有较大差异。建议使用B兼容性。例如,CREATE DATABASE dbcompatibility=’B’