环境部署

    • 环境中安装python2.7.12以上版本Python。
    • 数据库需要开启对PL/Python存储过程的支持。
    • 安装算法库需要拥有管理员权限的用户。

    操作步骤

    1. 编译部署数据库。

      其他编译保持步骤不变;

      编译完成后,需要重新gs_initdb;

      默认PL/Python存储过程模块不被加载,请执行“CREATE EXTENSION plpythonu”来加载模块。

    2. 算法库编译和安装。

      算法库使用开源的MADlib机器学习框架。源码包和相应patch可以从第三方库的代码仓库里获取。安装命令如下:

      其中, {YOUR_MADLIB_INSTALL_FOLDER}需要改为用户的实际安装路径。

    3. 将算法库安装到数据库中。

      1. 进入 bin文件夹。
      2. 执行如下命令。

        命令中参数说明如下:

        • -s:schema的名称。
        • -p:数据库平台,使用opengauss即可。
        • -c:连接数据库的参数。包括用户名、‘@’、IP地址、端口号和目标数据库名称。

        说明: - 目标数据库必须存在。 - IP请使用127.0.0.1,不要使用localhost。 - 涉及到大量PL/Python存储过程的安装、卸载等操作,需要数据库管理员权限用户来进行,普通用户没有权限创建和修改PL/Python存储过程,只能调用。 - 数据库兼容性,推荐兼容性为B。不同的数据库兼容性下,对空值,NULL等处理有较大差异。建议使用B兼容性。例如,CREATE DATABASE dbcompatibility=’B’