Ë ÂrœhˆHãó,—ddlmZddlZddlZddlmZddlmZmZm Z ddl mZmZ ddlm Z ddlZddlmZmZmZmZmZmZddlmZdd lmZdd lmZej<e«Z er e«rddl!m"Z"dd„Z#Gd „de«Z$y#e$r ddlm Z YŒdwxYw)é)ÚannotationsN)ÚPath)Ú TYPE_CHECKINGÚAnyÚCallable)Úload_onnx_modelÚload_openvino_model)ÚSelf)Ú AutoConfigÚ AutoModelÚ AutoTokenizerÚ MT5ConfigÚPretrainedConfigÚT5Config)Úis_peft_available)Úfind_adapter_config_file)ÚInputModule©Ú PeftConfigcó‡‡—dˆˆfd„}|S)Ncót•—tjt|«‰zd¬«‰t|«‰zfi|¤ŽS)NT)Úexist_ok)ÚosÚmakedirsr)Úsave_directoryÚkwargsÚ_save_pretrained_fnÚ subfolders €€ú{/var/www/html/ai-insurance-compliance-backend/venv/lib/python3.12/site-packages/sentence_transformers/models/Transformer.pyÚwrapperz)_save_pretrained_wrapper..wrappers5ø€Ü ‰”D˜Ó(¨9Ñ4¸tÕDÙ"¤4¨Ó#7¸)Ñ#CÑNÀvÑNÐNó)rz str | PathÚreturnÚNone©)rrr s`` rÚ_save_pretrained_wrapperr%sù€öOð€Nr!cóþ‡—eZdZUdZdZded<ddgZded<d Zd ed< d dˆfd„ Z dd „Z dd„Z dd„Zdd„Zdd„Z dd„Zd d„Z d! d"d„Zd!d#d„Ze d$ d%d„«Ze d$ d&d„«Ze d' d(ˆfd„ «ZˆxZS))ÚTransformeraHugging Face AutoModel to generate token embeddings. Loads the correct class, e.g. BERT / RoBERTa etc. Args: model_name_or_path: Hugging Face models name (https://huggingface.co/models) max_seq_length: Truncate any inputs longer than max_seq_length model_args: Keyword arguments passed to the Hugging Face Transformers model tokenizer_args: Keyword arguments passed to the Hugging Face Transformers tokenizer config_args: Keyword arguments passed to the Hugging Face Transformers config cache_dir: Cache dir for Hugging Face Transformers to store/load models do_lower_case: If true, lowercases the input (independent if the model is cased or not) tokenizer_name_or_path: Name or path of the tokenizer. When None, then model_name_or_path is used backend: Backend used for model inference. Can be `torch`, `onnx`, or `openvino`. Default is `torch`. úsentence_bert_config.jsonÚstrÚconfig_file_nameÚmax_seq_lengthÚ do_lower_casez list[str]Úconfig_keysTÚboolÚsave_in_rootc ó¨•—t‰|«||_| |_|€i}|€i}|€i}|j ||| |«\} }|j || || |fi|¤Ž| d|vr||d<t j||n|fd|i|¤Ž|_|€Št|jd«rtt|jjd«rTt|jd«r>t|jjj|jj«}||_|:|jj j"|jj_yy)NÚmodel_max_lengthÚ cache_dirÚconfigÚmax_position_embeddings)ÚsuperÚ__init__r,ÚbackendÚ_load_configÚ_load_modelr Úfrom_pretrainedÚ tokenizerÚhasattrÚ auto_modelr3Úminr4r1r+Ú __class__Ú__name__Útokenizer_class) ÚselfÚmodel_name_or_pathr+Ú model_argsÚtokenizer_argsÚconfig_argsr2r,Útokenizer_name_or_pathr7r3Ú is_peft_modelr?s €rr6zTransformer.__init__@s^ø€ô ‰ÑÔØ*ˆÔØˆŒØÐØˆJØÐ!ØˆNØÐØˆKà $× 1Ñ 1Ð2DÀiÐQXÐZeÓ fÑˆ Øˆ×ÑÐ+¨V°YÀÈÑeÐZdÒeàÐ%Ð*<ÀNÑ*RØ1?ˆNÐ-Ñ.Ü&×6Ñ6Ø&<Ð&HÑ"ÐN`ñ àð ðñ ˆŒðÐ!ä˜Ÿ™¨Ô2Ü˜DŸO™O×2Ñ2Ð4MÔNÜ˜DŸN™NÐ,>Ô?ä!$ T§_¡_×%;Ñ%;×%SÑ%SÐUY×UcÑUc×UtÑUtÓ!uà,ˆÔà!Ð-Ø59·^±^×5MÑ5M×5VÑ5VˆDO‰O×"Ñ"Õ2ð.r!c ó@—t|||jd«|jd«|jdd«¬« Dt«std«‚|dk7rt d«‚d d lm}|j|fi|¤d|i¤ŽdfStj|fi|¤d|i¤ŽdfS) a°Loads the transformers or PEFT configuration Args: model_name_or_path (str): The model name on Hugging Face (e.g. 'sentence-transformers/all-MiniLM-L6-v2') or the path to a local model directory. cache_dir (str | None): The cache directory to store the model configuration. backend (str): The backend used for model inference. Can be `torch`, `onnx`, or `openvino`. config_args (dict[str, Any]): Keyword arguments passed to the Hugging Face Transformers config. Returns: tuple[PretrainedConfig, bool]: The model configuration and a boolean indicating whether the model is a PEFT model. ÚtokenÚrevisionÚlocal_files_onlyF)r2rJrKrLzgLoading a PEFT model requires installing the `peft` package. You can install it via `pip install peft`.ÚtorchaPEFT models can currently only be loaded with the `torch` backend. To use other backends, load the model with `backend="torch"`, call `model.transformers_model.merge_and_unload()`, save that model with `model.save_pretrained()` and then load the model with the desired backend.rrr2T) rÚgetrÚ ExceptionÚ ValueErrorÚpeftrr:r)rBrCr2r7rFrs rr8zTransformer._load_configosÅ€ô %Ø"Ø#Ø!—o‘o gÓ.Ø$Ÿ™¨Ó4Ø!,§¡Ð1CÀUÓ!Kô ðð ô%Ô&ÜØ}óðð˜'Ò!ä ðwóðõ (à-:×-Ñ-Ð.@ÑeÀKÑeÐ[dÒeÐgkÐkÐkä×)Ñ)Ð*<ÑaÀÑaÐW`ÒaÐchÐhÐhr!cóž—|dk(r†|rdD]}|j|d«Œt|t«r|j|||fi|¤Žyt|t«r|j |||fi|¤Žyt j|f||dœ|¤Ž|_y|dk(rtd||ddœ|¤Ž|_y|dk(rtd||ddœ|¤Ž|_ytd |›d «‚)aÉLoads the transformers or PEFT model into the `auto_model` attribute Args: model_name_or_path (str): The model name on Hugging Face (e.g. 'sentence-transformers/all-MiniLM-L6-v2') or the path to a local model directory. config ("PeftConfig" | PretrainedConfig): The model configuration. cache_dir (str | None): The cache directory to store the model configuration. backend (str): The backend used for model inference. Can be `torch`, `onnx`, or `openvino`. is_peft_model (bool): Whether the model is a PEFT model. model_args (dict[str, Any]): Keyword arguments passed to the Hugging Face Transformers model. rM)rKN©r3r2Úonnxzfeature-extraction)rCr3Ú task_nameÚopenvinozUnsupported backend 'z6'. `backend` should be `torch`, `onnx`, or `openvino`.r$)ÚpopÚ isinstancerÚ_load_t5_modelrÚ_load_mt5_modelrr:r=rr rP)rBrCr3r2r7rHrDÚadapter_only_kwargs rr9zTransformer._load_model™s€ð(gÒñØ*6ò=Ð&Ø—N‘NÐ#5°tÕ<ð=ô˜&¤(Ô+Ø#×#Ñ#Ð$6¸À ÑXÈZÓXÜ˜F¤IÔ.Ø$×$Ñ$Ð%7¸ÀÑYÈjÓYä"+×";Ñ";Ø&ð#Ø/5Àñ#ØNXñ#•ð˜Ò Ü-ðØ#5ØØ.ñðñ ˆDOð˜ Ò "Ü1ðØ#5ØØ.ñðñ ˆDOôÐ4°W°IÐ=sÐtÓuÐur!cóV—ddlm}dg|_|j|f||dœ|¤Ž|_y)úLoads the encoder model from T5r)ÚT5EncoderModelú decoder.*rSN)Útransformersr^Ú"_keys_to_ignore_on_load_unexpectedr:r=)rBrCr3r2rDr^s rrYzTransformer._load_t5_modelÍs8€å/à=H¸MˆÔ9Ø8˜.×8Ñ8Øð Ø'-¸ñ ØFPñ ˆr!cóV—ddlm}dg|_|j|f||dœ|¤Ž|_y)r]r)ÚMT5EncoderModelr_rSN)r`rcrar:r=)rBrCr3r2rDrcs rrZzTransformer._load_mt5_modelÖs8€å0à>I¸]ˆÔ:Ø9˜/×9Ñ9Øð Ø'-¸ñ ØFPñ ˆr!có|—dt|j«|jjj¬«›dS)NzTransformer()Úarchitectureú))ÚdictÚget_config_dictr=r?r@©rBs rÚ__repr__zTransformer.__repr__ßs3€Øœd 4×#7Ñ#7Ó#9ÈÏÉ×HaÑHa×HjÑHjÔkÐlÐlmÐnÐnr!cól—|j«Dcic]\}}|dvr||“Œ}}}|jd i|¤|¤ddi¤Ž}|d}||d<t«r®ddlm}t|j|«r’|jjjrr|jd«} |d} tj| |jjj| j¬«}tj|| fd ¬ «|d<|jjjrd|vr|d|d<|Scc}}w)z#Returns token_embeddings, cls_token)Ú input_idsÚattention_maskÚtoken_type_idsÚ inputs_embedsÚreturn_dictTrÚtoken_embeddings)ÚPeftModelForFeatureExtractionrm)Údeviceé)ÚdimÚ hidden_statesÚall_layer_embeddingsr$)Úitemsr=rrQrrrXÚactive_peft_configÚis_prompt_learningÚsizerMÚonesÚnum_virtual_tokensrsÚcatr3Úoutput_hidden_states)rBÚfeaturesrÚkeyÚvalueÚtrans_featuresÚoutputsrqrrÚ batch_sizermÚprefix_attention_masks rÚforwardzTransformer.forwardâs7€ð'Ÿn™nÓ.÷ áUØÐXÑXð ‰Jð ˆñ ð"$—/‘/ÑO NÐO°fÑOÈ$ÒOˆØ" 1™:ÐØ'7ˆÐ#Ñ$ôÔÝ:ô˜4Ÿ?™?Ð,IÔJØ—O‘O×6Ñ6×IÒIà-×2Ñ2°1Ó5 Ø!)Ð*:Ñ!;Ü(-¯ © Ø §¡× BÑ B× UÑ UÐ^l×^sÑ^sô)Ð%ô.3¯Y©YÐ8MÈ~Ð7^ÐdeÔ-fÐ)Ñ*à?‰?×!Ñ!×6Ò6¸?ÈgÑ;UØ/6°Ñ/GˆHÐ+Ñ,àˆùó; s”D0cóB—|jjjS)N)r=r3Úhidden_sizeris rÚget_word_embedding_dimensionz(Transformer.get_word_embedding_dimensions€Ø‰×%Ñ%×1Ñ1Ð1r!c óê—i}t|dt«r|g}n¦t|dt«r\g}g|d<|D]L}tt |j«««\}}|j |«|dj |«ŒN|g}n7gg} }|D]*} |j | d«| j | d«Œ,|| g}|Dcgc])}|Dcgc]}t|«j«‘Œc}‘Œ+}}}|jr-|Dcgc] }|Dcgc]}|j«‘Œc}‘Œ"}}}|j|j||dd|jdœŽ«|Scc}wcc}}wcc}wcc}}w)z-Tokenizes a text and maps tokens to token-idsrÚ text_keysrtÚ longest_firstÚpt)ÚpaddingÚ truncationÚreturn_tensorsÚ max_length) rXr)rgÚnextÚiterrxÚappendÚstripr,ÚlowerÚupdater;r+) rBÚtextsrÚoutputÚto_tokenizeÚlookupÚtext_keyÚtextÚbatch1Úbatch2Ú text_tupleÚcolÚss rÚtokenizezTransformer.tokenizesr€ðˆÜe˜A‘h¤Ô$Ø ˜'‰KÜ ˜˜a™¤$Ô 'ØˆKØ"$ˆF;ÑØò 5Ü!%¤d¨6¯<©<«>Ó&:Ó!;‘˜$Ø×"Ñ" 4Ô(Ø{Ñ#×*Ñ*¨8Õ4ð 5ð'˜-‰Kà FˆFØ#ò - Ø— ‘ ˜j¨™mÔ,Ø— ‘ ˜j¨™mÕ,ð -ð" 6Ð*ˆKðAL×L¸°Ö4¨1œ˜A›Ÿ™Ô4ÐLˆÑLð×ÒØ?J×K¸¨sÖ3¨!˜AŸG™GIÔ3ÐKˆKÑKà ‰ ØˆDN‰NØØØ*Ø#Ø×.Ñ.ò ô ðˆ ùò5ùÓLùò4ùÓKs0Ã E$Ã EÃ.E$Ä E/ÄE*Ä'E/ÅE$Å*E/có–—|jj||¬«|jj|«|j|«y)N)Úsafe_serialization)r=Úsave_pretrainedr;Úsave_config)rBÚoutput_pathr¦rs rÚsavezTransformer.save.s:€Ø‰×'Ñ'¨ÐHZÐ'Ô[Ø‰×&Ñ& {Ô3Ø×Ñ˜Õ%r!c óN—|j||||||||| | |¬«} |dd|i| ¤ŽS)N)rCrrJÚcache_folderrKrLÚtrust_remote_codeÚmodel_kwargsÚtokenizer_kwargsÚ config_kwargsr7rCr$)Ú_load_init_kwargs)ÚclsrCrrJr¬rKrLrr®r¯r°r7rÚinit_kwargss rÚloadzTransformer.load3sP€ð$×+Ñ+Ø1ØØØ%ØØ-Ø/Ø%Ø-Ø'Øð,ó ˆñÑHÐ&8ÐH¸KÑHÐHr!có„—|j||||||¬«} |||||dœ}d| vri| d<d| vri| d<d| vri| d<| dj|«| dj|«| dj|«|r| dj|«| r| dj| «| r| dj| «i| ¥||dœ¥S)N)rCrrJr¬rKrL)rrJrKrLrrDrErF)r2r7)Úload_configr˜)r²rCrrJr¬rKrLrr®r¯r°r7rr3Ú hub_kwargss rr±zTransformer._load_init_kwargsTs€ð$—‘Ø1ØØØ%ØØ-ð !ó ˆð#ØØ Ø 0Ø!2ñ ˆ ð˜vÑ%Ø#%ˆF<Ñ Ø 6Ñ)Ø')ˆFÐ#Ñ$Ø Ñ&Ø$&ˆF=Ñ!ð ˆ|Ñ×#Ñ# JÔ/ØÐÑ ×'Ñ'¨ Ô3Øˆ}Ñ×$Ñ$ ZÔ0ñØ<Ñ ×'Ñ'¨Ô5ÙØÐ#Ñ$×+Ñ+Ð,<Ô=ÙØ=Ñ!×(Ñ(¨Ô7àH&ÐH |ÀÒHÐHr!c ó•—|r|gngd¢}|D]}t‰ ||||||||¬«} | sŒnd vrd| dvr| djd«d| vrd| dvr| djd«d| vrd| dvr| djd«| S)N)r(zsentence_roberta_config.jsonzsentence_distilbert_config.jsonzsentence_camembert_config.jsonzsentence_albert_config.jsonz sentence_xlm-roberta_config.jsonzsentence_xlnet_config.json)rCrÚconfig_filenamerJr¬rKrLrDrrErF)r5r¶rW)r²rCrr¹rJr¬rKrLÚconfig_filenamesr3r?s €rr¶zTransformer.load_configŽsàø€ñðÑòð ð 0ò ˆOÜ‘WÑ(Ø#5Ø#Ø /ØØ)Ø!Ø!1ð)óˆFòÙð ð˜6Ñ!Ð&9¸VÀLÑ=QÑ&QØ<Ñ ×$Ñ$Ð%8Ô9Ø˜vÑ%Ð*=ÀÐHXÑAYÑ*YØÐ#Ñ$×(Ñ(Ð)<Ô=Ø˜FÑ"Ð':¸fÀ]Ñ>SÑ'SØ=Ñ!×%Ñ%Ð&9Ô:Øˆ r!)NNNNNFNrM)rCr)r+z int | NonerDúdict[str, Any] | NonerEr»rFr»r2ú str | Noner,r.rGr¼r7r)r"r#) rCr)r2r¼r7r)rFúdict[str, Any]r"z*tuple[PeftConfig | PretrainedConfig, bool])rCr)r3zPeftConfig | PretrainedConfigr2r)r7r)rHr.r"r#)rCr)r3rr2r)r"r#)r"r))r€údict[str, torch.Tensor]r"r¾)r"Úint)T)r™z.list[str] | list[dict] | list[tuple[str, str]]rz str | boolr"r¾)r©r)r¦r.r"r#) ÚNNNFFNNNrM)rCr)rr)rJúbool | str | Noner¬r¼rKr¼rLr.rr.r®r»r¯r»r°r»r7r)r"r )rCr)rr)rJrÁr¬r¼rKr¼rLr.rr.r®r»r¯r»r°r»r7r)r"r½)rÀNNNNF)rCr)rr)r¹r¼rJrÁr¬r¼rKr¼rLr.r"r½)r@Ú __module__Ú__qualname__Ú__doc__r*Ú__annotations__r-r/r6r8r9rYrZrjr‡rŠr¤rªÚclassmethodr´r±r¶Ú __classcell__)r?s@rr'r'$scø…ñð.8ÐcÓ7Ø.°Ð@€KÓ@Ø€L$Óð &*Ø,0Ø04Ø-1Ø $Ø#Ø-1Øð-Wàð-Wð#ð-Wð*ð -Wð .ð-Wð+ð -Wðð-Wðð-Wð!+ð-Wðð-Wð õ-Wð^(iØ"%ð(iØ2<ð(iØGJð(iØYgð(ià 3ó(iðT2vàð2vð.ð2vðð 2vð ð2vðð 2vð ó2vóh ó óoóóB2ð\`ð&ØCð&ØNXð&à ó&ôP&ð ð Ø#'Ø#'Ø#Ø!&à"'Ø.2Ø26Ø/3ØðIàðIðð Ið !ðIð!ð IððIððIð ðIð,ðIð0ðIð-ðIððIð ò!IóðIð@ð Ø#'Ø#'Ø#Ø!&à"'Ø.2Ø26Ø/3Øð7Iàð7Iðð 7Ið !ð7Ið!ð 7Iðð7Iðð7Ið ð7Ið,ð7Ið0ð7Ið-ð7Iðð7Ið ò!7Ióð7IðrðØ&*Ø#'Ø#'Ø#Ø!&ð+àð+ðð+ð$ð +ð !ð+ð!ð +ðð+ðð+ð ô+óô+r!r')rrrr)r"zCallable[..., None])%Ú __future__rÚloggingrÚpathlibrÚtypingrrrÚsentence_transformers.backendrr r ÚImportErrorÚtyping_extensionsrMr`rrr rrrÚtransformers.utils.import_utilsrÚtransformers.utils.peft_utilsrÚ(sentence_transformers.models.InputModulerÚ getLoggerr@ÚloggerrQrr%r'r$r!rúrÔs{ðÝ"ãÛ Ýß/Ñ/çNð'Ýó ßd×dÝ=ÝBå@à ˆ× Ñ ˜8Ó $€áÑ&Ô(ÝóôV+õVøð1ò'ß&ð'ús¨BÂBÂB