构建可扩展的应用程序 - 生产环境性能和数据处理技巧 - 《OceanBase v2.2.50 官方教程》

数据处理技术分为两个类型：迭代运算和集合运算。

在迭代处理中，应用程序使用条件循环遍历一组行数据。

典型的迭代处理流程如下（并不是每一步都是必需的），用到了客户端/服务器模型：

您可以使用三种主要技术实现迭代算法：逐行处理、数组处理和手动并行。

在逐行处理中，单进程遍历数据集，并且每次在单个行上操作。在典型的实现中，应用程序从数据库中检索一行，在中间层处理，然后将行发送回数据库，数据库执行 DML 并提交。

假设您有个需求，需要处理一个表 raw_list 中记录，把每行记录分拆为两笔记录插入到表 op_list 中。下面的 PL 程序示例代码使用逐行处理技术实现了这个需求。

逐行处理技术有如下的优点：

分组处理与逐行处理相同，只是它在每次迭代中处理多行，而不是单行。如下示例：

上面代码跟逐行迭代处理区别在于在 FETCH 语句中使用了 BULK COLLECT 操作符分组获取数据，并限制了每组大小 array_size 。

相比于逐行迭代处理技术，分组迭代技术有如下优点：

分组迭代技术的缺点跟逐行迭代技术是一样的，面对大数据量时，这个处理时间也是不能接受的。此外就是应用程序也只能串行执行，不能发挥数据库的并行处理能力。

手动并行迭代与逐行和分组处理使用相同的迭代算法，但允许多个服务器进程划分工作并并行运行。

手动并行处理技术有如下优点：

手动并行处理技术有如下缺点：

基于集合的处理是一种 SQL 技术，它的处理对象是数据库中的数据集。

在基于集合的模型中，SQL 语句定义了结果，并允许数据库确定最有效的获取方法。相反，迭代算法使用条件逻辑将数据库中的每一行或每一组数据行拉到客户端应用程序，处理客户端上的数据，然后将数据发送回数据库。基于集合的处理消除了网络往返和数据库API开销，因为数据不会离开数据库。

还是以前面例子为例，以下 SQL 语句使用基于集合的算法满足这一要求：

INSERT 语句后的 SELECT 子句读取了所有数据同时一次性写入到目标表，然后应用一次性提交事务。

相比迭代算法，基于集合技术有如下优点：