Releases · magda-io/magda-embedding-api

28 Jan 01:02

t83714

v1.1.0

c9afcfd

v1.1.0 Latest

Latest

What's New

Rename EmbeddingGenerator to EmbeddingEncoder
Fixed serverOptions weren't passed through properly in test cases
Upgrade to @huggingface/transformers v3.2.4
Upgrade onnxruntime-node v1.20.1
Avoid including unused models in docker images (smaller image size)
Increase probe timeout seconds
Use worker pool
Process sentence list with separate model runs
set default workerTaskTimeout to 60 seconds
use quantized version (q8) default model
set default limits.memory to 850M
set default replicas number to 2
Add max_length config to model config (configurable via helm config)
set max_length of default model to 1024 due to excessive memory usage when working on text longer than 2048 (the default model supports up to 8192)
only use padding for multiple inputs received when encoding the input

Full Changelog: v1.0.0...v1.1.0

Assets 2

24 Jan 07:33

t83714

v1.1.0-alpha.3

772360e

v1.1.0-alpha.3 Pre-release

Pre-release

What's New

Rename EmbeddingGenerator to EmbeddingEncoder
Fixed serverOptions weren't passed through properly in test cases
Upgrade to @huggingface/transformers v3.2.4
Upgrade onnxruntime-node v1.20.1
Avoid including unused models in docker images (smaller image size)
Increase probe timeout seconds
Use worker pool
Process sentence list with separate model runs
set default workerTaskTimeout to 60 seconds
use quantized version (q8) default model
set default limits.memory to 850M
set default replicas number to 2
Add max_length config to model config (configurable via helm config)
set max_length of default model to 1024 due to excessive memory usage when working on text longer than 2048 (the default model supports up to 8192)
only use padding for multiple inputs received when encoding the input

Full Changelog: v1.0.0...v1.1.0-alpha.2

Assets 2

24 Jan 01:43

t83714

v1.1.0-alpha.2

3c40c6e

v1.1.0-alpha.2 Pre-release

Pre-release

What's New

Rename EmbeddingGenerator to EmbeddingEncoder
Fixed serverOptions weren't passed through properly in test cases
Upgrade to @huggingface/transformers v3.2.4
Upgrade onnxruntime-node v1.20.1
Avoid including unused models in docker images (smaller image size)
Increase probe timeout seconds
Use worker pool
Process sentence list with separate model runs
set default workerTaskTimeout to 60 seconds
set default limits.memory to 2000M
set default replicas number to 2

Full Changelog: v1.0.0...v1.1.0-alpha.2

Assets 2

21 Jan 12:14

t83714

v1.1.0-alpha.1

acdbe1b

v1.1.0-alpha.1 Pre-release

Pre-release

What's New

Rename EmbeddingGenerator to EmbeddingEncoder
Fixed serverOptions weren't passed through properly in test cases
Upgrade to @huggingface/transformers v3.2.4
Upgrade onnxruntime-node v1.20.1
Avoid including unused models in docker images (smaller image size)
Increase probe timeout seconds
Use worker pool
Process sentence list with separate model runs
set default workerTaskTimeout to 60 seconds
set default limits.memory to 1100M
set default replicas number to 2

Full Changelog: v1.0.0...v1.1.0-alpha.1

Assets 2

16 Jan 01:00

t83714

v1.1.0-alpha.0

73fc76d

v1.1.0-alpha.0 Pre-release

Pre-release

What's New

Rename EmbeddingGenerator to EmbeddingEncoder
Use non-quantized default model by default for better embedding performance but require more memory
Fixed serverOptions weren't passed through properly in test cases
Upgrade to @huggingface/transformers v3.2.4
Upgrade onnxruntime-node v1.20.1
Avoid including unused models in docker images
Increase probe timeout seconds
Use worker pool
Process sentence list with separate model runs

Full Changelog: v1.0.0...v1.1.0-alpha.0

Assets 2