配置 Milvus 以用于生产环境

  • storage_config
  • primary_path
  • wal_config
  • log_path
  • preload_table: 建议在内存允许的情况下尽可能多地加载 collection。这样在每次重启服务端之后,数据都会先载入到 Milvus 中,可以解决第一次搜索耗时很长的问题。
  • insert_buffer_size
    • (如果 WAL 开启了)建议 大于 wal_buffer_size 的一半 且插入数据量小于 wal_buffer_size的一半。
    • (如果 WAL 没有开启)建议插入的数据量小于 insert_buffer_size
  • cpu_cache_capacity:建议在内存允许的情况下尽可能调大。这样有助于确保数据全部在内存中,减少内存和磁盘的数据交换,从而提高查询性能。
  • use_blas_threhold: 影响的不同查询批量使用的距离计算函数。nq < 时使用 CPU 指令集进行查询,否则使用的是 OpenBLAS 来计算距离。大多数场景下,使用 CPU 指令集进行查询的性能会更好。
  • index_file_size:
    • (数据量不固定,连续有增量数据进入,并且伴随查询的场景)不宜设得太大,最好 256 MB 或者 512 MB,看具体情况而定。