Замена RuBERT на sentence-transformers/all-MiniLM-L12-v2, упрощение формулы расчета, поддержка загрузки из отдельных .npy файлов
This commit is contained in:
@@ -18,7 +18,7 @@ class Settings:
|
||||
|
||||
# Модель
|
||||
model_name: str = field(
|
||||
default_factory=lambda: os.getenv("RAG_MODEL", "DeepPavlov/rubert-base-cased")
|
||||
default_factory=lambda: os.getenv("RAG_MODEL", "sentence-transformers/all-MiniLM-L12-v2")
|
||||
)
|
||||
cache_dir: str = field(
|
||||
default_factory=lambda: os.getenv("RAG_CACHE_DIR", "data/models")
|
||||
@@ -73,8 +73,8 @@ class Settings:
|
||||
default_factory=lambda: int(os.getenv("RAG_AUTOSAVE_INTERVAL", "600")) # 10 минут
|
||||
)
|
||||
|
||||
# Размерность векторов (768 для ruBERT)
|
||||
vector_dim: int = 768
|
||||
# Размерность векторов (384 для all-MiniLM-L12-v2)
|
||||
vector_dim: int = 384
|
||||
|
||||
@property
|
||||
def is_auth_required(self) -> bool:
|
||||
|
||||
Reference in New Issue
Block a user