Ë
    ¹rœhR  ã            	       óÒ  — d Z ddlmZmZ ddlZddlZddlmZ ddlmZm	Z	m
Z
 ddlmZ ddlmZmZmZmZ dd	lmZ dd
lmZmZ ddlmZ ddlmZ  ej6                  e«      Zd-dej<                  dede dej<                  fd„Z! G d„ dejD                  «      Z# G d„ dejD                  «      Z$ G d„ dejD                  «      Z% G d„ dejD                  «      Z& G d„ dejD                  «      Z' G d„ dejD                  «      Z( G d„ d ejD                  «      Z)e G d!„ d"e«      «       Z*e G d#„ d$e*«      «       Z+ ed%¬&«       G d'„ d(e*«      «       Z, ed)¬&«       G d*„ d+e*e«      «       Z-g d,¢Z.y).zPyTorch ConvNextV2 model.é    )ÚOptionalÚUnionN)Únn)ÚBCEWithLogitsLossÚCrossEntropyLossÚMSELossé   )ÚACT2FN)ÚBackboneOutputÚBaseModelOutputWithNoAttentionÚ(BaseModelOutputWithPoolingAndNoAttentionÚ$ImageClassifierOutputWithNoAttention)ÚPreTrainedModel)Úauto_docstringÚlogging)ÚBackboneMixiné   )ÚConvNextV2ConfigÚinputÚ	drop_probÚtrainingÚreturnc                 ó  — |dk(  s|s| S d|z
  }| j                   d   fd| j                  dz
  z  z   }|t        j                  || j                  | j
                  ¬«      z   }|j                  «        | j                  |«      |z  }|S )aF  
    Drop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).

    Comment by Ross Wightman: This is the same as the DropConnect impl I created for EfficientNet, etc networks,
    however, the original name is misleading as 'Drop Connect' is a different form of dropout in a separate paper...
    See discussion: https://github.com/tensorflow/tpu/issues/494#issuecomment-532968956 ... I've opted for changing the
    layer and argument names to 'drop path' rather than mix DropConnect as a layer name and use 'survival rate' as the
    argument.
    ç        r   r   )r   )ÚdtypeÚdevice)ÚshapeÚndimÚtorchÚrandr   r   Úfloor_Údiv)r   r   r   Ú	keep_probr   Úrandom_tensorÚoutputs          ú…/var/www/html/ai-insurance-compliance-backend/venv/lib/python3.12/site-packages/transformers/models/convnextv2/modeling_convnextv2.pyÚ	drop_pathr'   )   s   € ð CÒ™xØˆØI‘€IØ[‰[˜‰^Ð ¨¯
©
°Q©Ñ 7Ñ7€EØ¤§
¡
¨5¸¿¹ÈEÏLÉLÔ YÑY€MØ×ÑÔØY‰YyÓ! MÑ1€FØ€Mó    c                   óx   ‡ — e Zd ZdZd	dee   ddfˆ fd„Zdej                  dej                  fd„Z	de
fd„Zˆ xZS )
ÚConvNextV2DropPathzXDrop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).Nr   r   c                 ó0   •— t         ‰|   «        || _        y ©N)ÚsuperÚ__init__r   )Úselfr   Ú	__class__s     €r&   r.   zConvNextV2DropPath.__init__A   s   ø€ Ü‰ÑÔØ"ˆr(   Úhidden_statesc                 óD   — t        || j                  | j                  «      S r,   )r'   r   r   ©r/   r1   s     r&   ÚforwardzConvNextV2DropPath.forwardE   s   € Ü˜¨¯©¸¿¹ÓFÐFr(   c                 ó    — d| j                   › S )Nzp=)r   )r/   s    r&   Ú
extra_reprzConvNextV2DropPath.extra_reprH   s   € ØD—N‘NÐ#Ð$Ð$r(   r,   )Ú__name__Ú
__module__Ú__qualname__Ú__doc__r   Úfloatr.   r   ÚTensorr4   Ústrr6   Ú__classcell__©r0   s   @r&   r*   r*   >   sG   ø„ Ùbñ# (¨5¡/ð #¸Tõ #ðG U§\¡\ð G°e·l±ló Gð%˜C÷ %r(   r*   c                   ó`   ‡ — e Zd ZdZdefˆ fd„Zdej                  dej                  fd„Zˆ xZ	S )ÚConvNextV2GRNz)GRN (Global Response Normalization) layerÚdimc                 óâ   •— t         ‰|   «        t        j                  t	        j
                  ddd|«      «      | _        t        j                  t	        j
                  ddd|«      «      | _        y )Nr   )r-   r.   r   Ú	Parameterr   ÚzerosÚweightÚbias)r/   rB   r0   s     €r&   r.   zConvNextV2GRN.__init__O   sL   ø€ Ü‰ÑÔÜ—l‘l¤5§;¡;¨q°!°Q¸Ó#<Ó=ˆŒÜ—L‘L¤§¡¨Q°°1°cÓ!:Ó;ˆ	r(   r1   r   c                 óÂ   — t         j                  j                  |ddd¬«      }||j                  dd¬«      dz   z  }| j                  ||z  z  | j
                  z   |z   }|S )Né   )r   rI   T)ÚordrB   Úkeepdiméÿÿÿÿ)rB   rK   çíµ ÷Æ°>)r   ÚlinalgÚvector_normÚmeanrF   rG   )r/   r1   Úglobal_featuresÚnorm_featuress       r&   r4   zConvNextV2GRN.forwardT   si   € äŸ,™,×2Ñ2°=ÀaÈVÐ]aÐ2ÓbˆØ'¨?×+?Ñ+?ÀBÐPTÐ+?Ó+UÐX\Ñ+\Ñ]ˆØŸ™ }°}Ñ'DÑEÈÏ	É	ÑQÐTaÑaˆàÐr(   )
r7   r8   r9   r:   Úintr.   r   ÚFloatTensorr4   r>   r?   s   @r&   rA   rA   L   s1   ø„ Ù3ð<˜Cõ <ð
 U×%6Ñ%6ð ¸5×;LÑ;L÷ r(   rA   c                   ó\   ‡ — e Zd ZdZdˆ fd„	Zdej                  dej                  fd„Zˆ xZS )ÚConvNextV2LayerNormaA  LayerNorm that supports two data formats: channels_last (default) or channels_first.
    The ordering of the dimensions in the inputs. channels_last corresponds to inputs with shape (batch_size, height,
    width, channels) while channels_first corresponds to inputs with shape (batch_size, channels, height, width).
    c                 óN  •— t         ‰|   «        t        j                  t	        j
                  |«      «      | _        t        j                  t	        j                  |«      «      | _        || _	        || _
        | j                  dvrt        d| j                  › «      ‚|f| _        y )N)Úchannels_lastÚchannels_firstzUnsupported data format: )r-   r.   r   rD   r   ÚonesrF   rE   rG   ÚepsÚdata_formatÚNotImplementedErrorÚnormalized_shape)r/   r^   r[   r\   r0   s       €r&   r.   zConvNextV2LayerNorm.__init__d   s…   ø€ Ü‰ÑÔÜ—l‘l¤5§:¡:Ð.>Ó#?Ó@ˆŒÜ—L‘L¤§¡Ð-=Ó!>Ó?ˆŒ	ØˆŒØ&ˆÔØ×ÑÐ#FÑFÜ%Ð(AÀ$×BRÑBRÐASÐ&TÓUÐUØ!1Ð 3ˆÕr(   Úxr   c                 ód  — | j                   dk(  rWt        j                  j                  j	                  || j
                  | j                  | j                  | j                  «      }|S | j                   dk(  rº|j                  }|j                  «       }|j                  dd¬«      }||z
  j                  d«      j                  dd¬«      }||z
  t        j                  || j                  z   «      z  }|j                  |¬«      }| j                  d d …d d f   |z  | j                  d d …d d f   z   }|S )NrX   rY   r   T)rK   rI   )r   )r\   r   r   Ú
functionalÚ
layer_normr^   rF   rG   r[   r   r;   rP   ÚpowÚsqrtÚto)r/   r_   Úinput_dtypeÚuÚss        r&   r4   zConvNextV2LayerNorm.forwardn   s
  € Ø×Ñ˜Ò.Ü—‘×#Ñ#×.Ñ.¨q°$×2GÑ2GÈÏÉÐVZ×V_ÑV_Ðae×aiÑaiÓjˆAð ˆð ×ÑÐ!1Ò1ØŸ'™'ˆKØ—‘“	ˆAØ—‘q $Ó'ˆAØQ‘—‘˜A“×#Ñ# A¨tÐ#Ó4ˆAØQ‘œ%Ÿ*™* Q¨¯©¡\Ó2Ñ2ˆAØ—‘˜;Ó'ˆAØ—‘šA˜t T˜MÑ*¨QÑ.°·±º1¸dÀD¸=Ñ1IÑIˆAØˆr(   )rM   rX   )	r7   r8   r9   r:   r.   r   r<   r4   r>   r?   s   @r&   rV   rV   ^   s(   ø„ ñõ
4ð˜Ÿ™ð ¨%¯,©,÷ r(   rV   c                   óZ   ‡ — e Zd ZdZˆ fd„Zdej                  dej                  fd„Zˆ xZ	S )ÚConvNextV2Embeddingsz‡This class is comparable to (and inspired by) the SwinEmbeddings class
    found in src/transformers/models/swin/modeling_swin.py.
    c                 ó  •— t         ‰|   «        t        j                  |j                  |j
                  d   |j                  |j                  ¬«      | _        t        |j
                  d   dd¬«      | _	        |j                  | _        y )Nr   ©Úkernel_sizeÚstriderM   rY   ©r[   r\   )
r-   r.   r   ÚConv2dÚnum_channelsÚhidden_sizesÚ
patch_sizeÚpatch_embeddingsrV   Ú	layernorm©r/   Úconfigr0   s     €r&   r.   zConvNextV2Embeddings.__init__‚   sr   ø€ Ü‰ÑÔÜ "§	¡	Ø×Ñ ×!4Ñ!4°QÑ!7ÀV×EVÑEVÐ_e×_pÑ_pô!
ˆÔô -¨V×-@Ñ-@ÀÑ-CÈÐ[kÔlˆŒØ"×/Ñ/ˆÕr(   Úpixel_valuesr   c                 óœ   — |j                   d   }|| j                  k7  rt        d«      ‚| j                  |«      }| j	                  |«      }|S )Nr   zeMake sure that the channel dimension of the pixel values match with the one set in the configuration.)r   rq   Ú
ValueErrorrt   ru   )r/   rx   rq   Ú
embeddingss       r&   r4   zConvNextV2Embeddings.forwardŠ   sV   € Ø#×)Ñ)¨!Ñ,ˆØ˜4×,Ñ,Ò,ÜØwóð ð ×*Ñ*¨<Ó8ˆ
Ø—^‘^ JÓ/ˆ
ØÐr(   ©
r7   r8   r9   r:   r.   r   rT   r<   r4   r>   r?   s   @r&   rj   rj   }   s*   ø„ ñô0ð E×$5Ñ$5ð ¸%¿,¹,÷ r(   rj   c                   ó\   ‡ — e Zd ZdZdˆ fd„	Zdej                  dej                  fd„Zˆ xZ	S )ÚConvNextV2Layera5  This corresponds to the `Block` class in the original implementation.

    There are two equivalent implementations: [DwConv, LayerNorm (channels_first), Conv, GELU,1x1 Conv]; all in (N, C,
    H, W) (2) [DwConv, Permute to (N, H, W, C), LayerNorm (channels_last), Linear, GELU, Linear]; Permute back

    The authors used (2) as they find it slightly faster in PyTorch.

    Args:
        config ([`ConvNextV2Config`]): Model configuration class.
        dim (`int`): Number of input channels.
        drop_path (`float`): Stochastic depth rate. Default: 0.0.
    c                 ó°  •— t         ‰|   «        t        j                  ||dd|¬«      | _        t        |d¬«      | _        t        j                  |d|z  «      | _        t        |j                     | _        t        d|z  «      | _        t        j                  d|z  |«      | _        |dkD  rt        |«      | _        y t        j                   «       | _        y )Né   r	   )rm   ÚpaddingÚgroupsrM   ©r[   é   r   )r-   r.   r   rp   ÚdwconvrV   ru   ÚLinearÚpwconv1r
   Ú
hidden_actÚactrA   ÚgrnÚpwconv2r*   ÚIdentityr'   )r/   rw   rB   r'   r0   s       €r&   r.   zConvNextV2Layer.__init__£   s¡   ø€ Ü‰ÑÔä—i‘i  S°aÀÈ3ÔOˆŒÜ,¨S°dÔ;ˆŒä—y‘y  a¨#¡gÓ.ˆŒÜ˜&×+Ñ+Ñ,ˆŒÜ   S¡Ó)ˆŒÜ—y‘y  S¡¨#Ó.ˆŒØ:CÀcº/Ô+¨IÓ6ˆÌrÏ{É{Ë}ˆr(   r1   r   c                 óN  — |}| j                  |«      }|j                  dddd«      }| j                  |«      }| j                  |«      }| j	                  |«      }| j                  |«      }| j                  |«      }|j                  dddd«      }|| j                  |«      z   }|S )Nr   rI   r	   r   )r…   Úpermuteru   r‡   r‰   rŠ   r‹   r'   )r/   r1   r   r_   s       r&   r4   zConvNextV2Layer.forward¯   s—   € ØˆØK‰K˜Ó&ˆàI‰Ia˜˜A˜qÓ!ˆØN‰N˜1ÓˆØL‰L˜‹OˆØH‰HQ‹KˆØH‰HQ‹KˆØL‰L˜‹OˆàI‰Ia˜˜A˜qÓ!ˆàD—N‘N 1Ó%Ñ%ˆØˆr(   )r   r|   r?   s   @r&   r~   r~   •   s+   ø„ ñõ
]ð U×%6Ñ%6ð ¸5¿<¹<÷ r(   r~   c                   ó\   ‡ — e Zd ZdZdˆ fd„	Zdej                  dej                  fd„Zˆ xZ	S )ÚConvNextV2Stagea  ConvNeXTV2 stage, consisting of an optional downsampling layer + multiple residual blocks.

    Args:
        config ([`ConvNextV2Config`]): Model configuration class.
        in_channels (`int`): Number of input channels.
        out_channels (`int`): Number of output channels.
        depth (`int`): Number of residual blocks.
        drop_path_rates(`list[float]`): Stochastic depth rates for each layer.
    c                 ó~  •— t         ‰	|   «        ||k7  s|dkD  r?t        j                  t	        |dd¬«      t        j
                  ||||¬«      «      | _        nt        j                  «       | _        |xs dg|z  }t        j                  t        |«      D cg c]  }t        ||||   ¬«      ‘Œ c}Ž | _
        y c c}w )Nr   rM   rY   ro   rl   r   )rB   r'   )r-   r.   r   Ú
SequentialrV   rp   Údownsampling_layerrŒ   Úranger~   Úlayers)
r/   rw   Úin_channelsÚout_channelsrm   rn   ÚdepthÚdrop_path_ratesÚjr0   s
            €r&   r.   zConvNextV2Stage.__init__Ì   s¤   ø€ Ü‰ÑÔà˜,Ò&¨&°1ª*Ü&(§m¡mÜ# K°TÐGWÔXÜ—	‘	˜+ |ÀÐU[Ô\ó'ˆDÕ#ô
 ')§k¡k£mˆDÔ#Ø)Ò:¨c¨U°U©]ˆÜ—m‘mÜ_dÐejÓ_kÖlÐZ[Œo˜f¨,À/ÐRSÑBTÖUÒlð
ˆùÚls   ÂB:r1   r   c                 óJ   — | j                  |«      }| j                  |«      }|S r,   )r“   r•   r3   s     r&   r4   zConvNextV2Stage.forwardÛ   s&   € Ø×/Ñ/°Ó>ˆØŸ™ MÓ2ˆØÐr(   )rI   rI   rI   Nr|   r?   s   @r&   r   r   Á   s*   ø„ ñõ
ð U×%6Ñ%6ð ¸5¿<¹<÷ r(   r   c                   óf   ‡ — e Zd Zˆ fd„Z	 	 ddej
                  dee   dee   dee	e
f   fd„Zˆ xZS )ÚConvNextV2Encoderc           
      ó,  •— t         ‰|   «        t        j                  «       | _        t        j                  d|j                  t        |j                  «      d¬«      j                  |j                  «      D cg c]  }|j                  «       ‘Œ }}|j                  d   }t        |j                  «      D ]V  }|j                  |   }t        ||||dkD  rdnd|j                  |   ||   ¬«      }| j                  j!                  |«       |}ŒX y c c}w )Nr   Úcpu)r   rI   r   )r–   r—   rn   r˜   r™   )r-   r.   r   Ú
ModuleListÚstagesr   ÚlinspaceÚdrop_path_rateÚsumÚdepthsÚsplitÚtolistrr   r”   Ú
num_stagesr   Úappend)	r/   rw   r_   r™   Úprev_chsÚiÚout_chsÚstager0   s	           €r&   r.   zConvNextV2Encoder.__init__ã   sý   ø€ Ü‰ÑÔÜ—m‘m“oˆŒô —^‘^ A v×'<Ñ'<¼cÀ&Ç-Á-Ó>PÐY^Ô_×eÑeÐfl×fsÑfsÓtö
àð H‰HJð
ˆð 
ð ×&Ñ& qÑ)ˆÜv×(Ñ(Ó)ò 	ˆAØ×)Ñ)¨!Ñ,ˆGÜ#ØØ$Ø$Ø šE‘q qØ—m‘m AÑ&Ø /°Ñ 2ôˆEð K‰K×Ñ˜uÔ%Ø‰Hñ	ùò
s   Á:Dr1   Úoutput_hidden_statesÚreturn_dictr   c                 ó¾   — |rdnd }t        | j                  «      D ]  \  }}|r||fz   } ||«      }Œ |r||fz   }|st        d„ ||fD «       «      S t        ||¬«      S )N© c              3   ó&   K  — | ]	  }|€Œ|–— Œ y ­wr,   r±   )Ú.0Úvs     r&   ú	<genexpr>z,ConvNextV2Encoder.forward.<locals>.<genexpr>
  s   è ø€ ÒX˜qÈ!É-œÑXùs   ‚Š)Úlast_hidden_stater1   )Ú	enumerater¡   Útupler   )r/   r1   r®   r¯   Úall_hidden_statesr«   Úlayer_modules          r&   r4   zConvNextV2Encoder.forwardø   s…   € ñ #7™B¸DÐä(¨¯©Ó5ò 	8‰OˆAˆ|Ù#Ø$5¸Ð8HÑ$HÐ!á(¨Ó7‰Mð		8ñ  Ø 1°]Ð4DÑ DÐáÜÑX ]Ð4EÐ$FÔXÓXÐXä-Ø+Ø+ô
ð 	
r(   )FT)r7   r8   r9   r.   r   rT   r   Úboolr   r¸   r   r4   r>   r?   s   @r&   r   r   â   sT   ø„ ôð0 05Ø&*ñ	
à×(Ñ(ð
ð ' t™nð
ð ˜d‘^ð	
ð
 
ˆuÐ4Ð4Ñ	5÷
r(   r   c                   ó,   — e Zd ZU eed<   dZdZdgZd„ Zy)ÚConvNextV2PreTrainedModelrw   Ú
convnextv2rx   r~   c                 ó¸  — t        |t        j                  t        j                  f«      rm|j                  j
                  j                  d| j                  j                  ¬«       |j                  %|j                  j
                  j                  «        yyt        |t        j                  t        f«      rJ|j                  j
                  j                  «        |j                  j
                  j                  d«       yt        |t        «      rI|j                  j
                  j                  «        |j                  j
                  j                  «        yy)zInitialize the weightsr   )rP   ÚstdNg      ð?)Ú
isinstancer   r†   rp   rF   ÚdataÚnormal_rw   Úinitializer_rangerG   Úzero_Ú	LayerNormrV   Úfill_rA   )r/   Úmodules     r&   Ú_init_weightsz'ConvNextV2PreTrainedModel._init_weights  sä   € äfœrŸy™y¬"¯)©)Ð4Ô5ð M‰M×Ñ×&Ñ&¨C°T·[±[×5RÑ5RÐ&ÔSØ{‰{Ð&Ø—‘× Ñ ×&Ñ&Õ(ð 'ä˜¤§¡Ô/BÐ CÔDØK‰K×Ñ×"Ñ"Ô$ØM‰M×Ñ×$Ñ$ SÕ)Ü˜¤Ô.ØM‰M×Ñ×$Ñ$Ô&ØK‰K×Ñ×"Ñ"Õ$ð /r(   N)	r7   r8   r9   r   Ú__annotations__Úbase_model_prefixÚmain_input_nameÚ_no_split_modulesrÉ   r±   r(   r&   r½   r½     s!   … àÓØ$ÐØ$€OØ*Ð+Ðó%r(   r½   c                   óx   ‡ — e Zd Zˆ fd„Ze	 	 	 ddeej                     dee   dee   de	e
ef   fd„«       Zˆ xZS )ÚConvNextV2Modelc                 óø   •— t         ‰|   |«       || _        t        |«      | _        t        |«      | _        t        j                  |j                  d   |j                  ¬«      | _        | j                  «        y )NrL   rƒ   )r-   r.   rw   rj   r{   r   Úencoderr   rÆ   rr   Úlayer_norm_epsru   Ú	post_initrv   s     €r&   r.   zConvNextV2Model.__init__,  s`   ø€ Ü‰Ñ˜Ô ØˆŒä.¨vÓ6ˆŒÜ(¨Ó0ˆŒô Ÿ™ f×&9Ñ&9¸"Ñ&=À6×CXÑCXÔYˆŒð 	‰Õr(   rx   r®   r¯   r   c                 ód  — ||n| j                   j                  }||n| j                   j                  }|€t        d«      ‚| j	                  |«      }| j                  |||¬«      }|d   }| j                  |j                  ddg«      «      }|s
||f|dd  z   S t        |||j                  ¬«      S )Nz You have to specify pixel_values©r®   r¯   r   éþÿÿÿrL   r   )r¶   Úpooler_outputr1   )
rw   r®   Úuse_return_dictrz   r{   rÑ   ru   rP   r   r1   )r/   rx   r®   r¯   Úembedding_outputÚencoder_outputsr¶   Úpooled_outputs           r&   r4   zConvNextV2Model.forward9  sÖ   € ð %9Ð$DÑ È$Ï+É+×JjÑJjð 	ð &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆàÐÜÐ?Ó@Ð@àŸ?™?¨<Ó8ÐàŸ,™,ØØ!5Ø#ð 'ó 
ˆð ,¨AÑ.Ðð Ÿ™Ð'8×'=Ñ'=¸rÀ2¸hÓ'GÓHˆáØ% }Ð5¸ÈÈÐ8KÑKÐKä7Ø/Ø'Ø)×7Ñ7ô
ð 	
r(   )NNN)r7   r8   r9   r.   r   r   r   rT   r»   r   r¸   r   r4   r>   r?   s   @r&   rÏ   rÏ   )  sk   ø„ ôð ð 59Ø/3Ø&*ñ	"
à˜u×0Ñ0Ñ1ð"
ð ' t™nð"
ð ˜d‘^ð	"
ð
 
ˆuÐ>Ð>Ñ	?ò"
ó ô"
r(   rÏ   zŠ
    ConvNextV2 Model with an image classification head on top (a linear layer on top of the pooled features), e.g. for
    ImageNet.
    )Úcustom_introc                   ó˜   ‡ — e Zd Zˆ fd„Ze	 	 	 	 ddeej                     deej                     dee	   dee	   de
eef   f
d„«       Zˆ xZS )	Ú ConvNextV2ForImageClassificationc                 ó0  •— t         ‰|   |«       |j                  | _        t        |«      | _        |j                  dkD  r-t        j                  |j                  d   |j                  «      nt        j                  «       | _	        | j                  «        y )Nr   rL   )r-   r.   Ú
num_labelsrÏ   r¾   r   r†   rr   rŒ   Ú
classifierrÓ   rv   s     €r&   r.   z)ConvNextV2ForImageClassification.__init__g  sy   ø€ Ü‰Ñ˜Ô à ×+Ñ+ˆŒÜ)¨&Ó1ˆŒð FL×EVÑEVÐYZÒEZŒBI‰If×)Ñ)¨"Ñ-¨v×/@Ñ/@ÔAÔ`b×`kÑ`kÓ`mð 	Œð
 	‰Õr(   rx   Úlabelsr®   r¯   r   c                 ó  — ||n| j                   j                  }| j                  |||¬«      }|r|j                  n|d   }| j	                  |«      }d}|‡| j                   j
                  €| j                  dk(  rd| j                   _        nl| j                  dkD  rL|j                  t        j                  k(  s|j                  t        j                  k(  rd| j                   _        nd| j                   _        | j                   j
                  dk(  rIt        «       }	| j                  dk(  r& |	|j                  «       |j                  «       «      }nŒ |	||«      }n‚| j                   j
                  dk(  r=t        «       }	 |	|j                  d| j                  «      |j                  d«      «      }n,| j                   j
                  dk(  rt        «       }	 |	||«      }|s|f|dd z   }
||f|
z   S |
S t!        |||j"                  ¬	«      S )
aŠ  
        labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
            Labels for computing the image classification/regression loss. Indices should be in `[0, ...,
            config.num_labels - 1]`. If `config.num_labels == 1` a regression loss is computed (Mean-Square loss), If
            `config.num_labels > 1` a classification loss is computed (Cross-Entropy).
        NrÕ   r   Ú
regressionÚsingle_label_classificationÚmulti_label_classificationrL   rI   )ÚlossÚlogitsr1   )rw   rØ   r¾   r×   rá   Úproblem_typerà   r   r   ÚlongrS   r   Úsqueezer   Úviewr   r   r1   )r/   rx   râ   r®   r¯   ÚoutputsrÛ   rè   rç   Úloss_fctr%   s              r&   r4   z(ConvNextV2ForImageClassification.forwardu  sÁ  € ð &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆà—/‘/ ,ÐEYÐgr/Ósˆá1<˜×-Ò-À'È!Á*ˆà—‘ Ó/ˆàˆØÑØ{‰{×'Ñ'Ð/Ø—?‘? aÒ'Ø/;D—K‘KÕ,Ø—_‘_ qÒ(¨f¯l©l¼e¿j¹jÒ.HÈFÏLÉLÔ\a×\eÑ\eÒLeØ/LD—K‘KÕ,à/KD—K‘KÔ,à{‰{×'Ñ'¨<Ò7Ü"›9Ø—?‘? aÒ'Ù# F§N¡NÓ$4°f·n±nÓ6FÓG‘Dá# F¨FÓ3‘DØ—‘×)Ñ)Ð-JÒJÜ+Ó-Ù §¡¨B°·±Ó @À&Ç+Á+ÈbÃ/ÓR‘Ø—‘×)Ñ)Ð-IÒIÜ,Ó.Ù ¨Ó/ÙØY ¨¨ Ñ,ˆFØ)-Ð)9TG˜fÑ$ÐE¸vÐEä3ØØØ!×/Ñ/ô
ð 	
r(   )NNNN)r7   r8   r9   r.   r   r   r   rT   Ú
LongTensorr»   r   r¸   r   r4   r>   r?   s   @r&   rÞ   rÞ   _  sƒ   ø„ ôð ð 59Ø-1Ø/3Ø&*ñ3
à˜u×0Ñ0Ñ1ð3
ð ˜×)Ñ)Ñ*ð3
ð ' t™nð	3
ð
 ˜d‘^ð3
ð 
ˆuÐ:Ð:Ñ	;ò3
ó ô3
r(   rÞ   zT
    ConvNeXT V2 backbone, to be used with frameworks like DETR and MaskFormer.
    c            
       óf   ‡ — e Zd Zˆ fd„Ze	 	 ddej                  dee   dee   de	fd„«       Z
ˆ xZS )ÚConvNextV2Backbonec                 óŽ  •— t         ‰|   |«       t         ‰| 	  |«       t        |«      | _        t        |«      | _        |j                  d   g|j                  z   | _        i }t        | j                  | j                  «      D ]  \  }}t        |d¬«      ||<   Œ t        j                  |«      | _        | j!                  «        y )Nr   rY   )r\   )r-   r.   Ú_init_backbonerj   r{   r   rÑ   rr   Únum_featuresÚzipÚ_out_featuresÚchannelsrV   r   Ú
ModuleDictÚhidden_states_normsrÓ   )r/   rw   rù   r­   rq   r0   s        €r&   r.   zConvNextV2Backbone.__init__³  s¶   ø€ Ü‰Ñ˜Ô Ü‰Ñ˜vÔ&ä.¨vÓ6ˆŒÜ(¨Ó0ˆŒØ#×0Ñ0°Ñ3Ð4°v×7JÑ7JÑJˆÔð !ÐÜ#& t×'9Ñ'9¸4¿=¹=Ó#Iò 	iÑˆE<Ü)<¸\ÐWgÔ)hÐ Ò&ð	iä#%§=¡=Ð1DÓ#EˆÔ ð 	‰Õr(   rx   r®   r¯   r   c                 ó¼  — ||n| j                   j                  }||n| j                   j                  }| j                  |«      }| j	                  |d|¬«      }|r|j
                  n|d   }d}t        | j                  |«      D ]/  \  }}	|| j                  v sŒ | j                  |   |	«      }	||	fz  }Œ1 |s|f}
|r|
|fz  }
|
S t        ||r|d¬«      S dd¬«      S )ar  
        Examples:

        ```python
        >>> from transformers import AutoImageProcessor, AutoBackbone
        >>> import torch
        >>> from PIL import Image
        >>> import requests

        >>> url = "http://images.cocodataset.org/val2017/000000039769.jpg"
        >>> image = Image.open(requests.get(url, stream=True).raw)

        >>> processor = AutoImageProcessor.from_pretrained("facebook/convnextv2-tiny-1k-224")
        >>> model = AutoBackbone.from_pretrained("facebook/convnextv2-tiny-1k-224")

        >>> inputs = processor(image, return_tensors="pt")
        >>> outputs = model(**inputs)
        ```NTrÕ   r   r±   )Úfeature_mapsr1   Ú
attentions)rw   rØ   r®   r{   rÑ   r1   rõ   Ústage_namesÚout_featuresrù   r   )r/   rx   r®   r¯   rÙ   rí   r1   rû   r­   Úhidden_stater%   s              r&   r4   zConvNextV2Backbone.forwardÄ  s  € ð2 &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆà$8Ð$DÑ È$Ï+É+×JjÑJjð 	ð  Ÿ?™?¨<Ó8Ðà—,‘,ØØ!%Ø#ð ó 
ˆñ 2=˜×-Ò-À'È!Á*ˆàˆÜ#& t×'7Ñ'7¸Ó#Gò 	0ÑˆE<Ø˜×)Ñ)Ò)Ø>˜t×7Ñ7¸Ñ>¸|ÓLØ  Ñ/‘ð	0ñ
 Ø"_ˆFÙ#Ø˜=Ð*Ñ*ØˆMäØ%Ù+?˜-Øô
ð 	
àEIØô
ð 	
r(   )NN)r7   r8   r9   r.   r   r   r<   r   r»   r   r4   r>   r?   s   @r&   rñ   rñ   ¬  sV   ø„ ôð" ð 04Ø&*ñ	7
à—l‘lð7
ð ' t™nð7
ð ˜d‘^ð	7
ð
 
ò7
ó ô7
r(   rñ   )rÞ   rÏ   r½   rñ   )r   F)/r:   Útypingr   r   r   Útorch.utils.checkpointr   Útorch.nnr   r   r   Úactivationsr
   Úmodeling_outputsr   r   r   r   Úmodeling_utilsr   Úutilsr   r   Úutils.backbone_utilsr   Úconfiguration_convnextv2r   Ú
get_loggerr7   Úloggerr<   r;   r»   r'   ÚModuler*   rA   rV   rj   r~   r   r   r½   rÏ   rÞ   rñ   Ú__all__r±   r(   r&   ú<module>r     s€  ðñ  ç "ã Û Ý ß AÑ Aå !÷ó õ .ß ,Ý 1Ý 6ð 
ˆ×	Ñ	˜HÓ	%€ñU—\‘\ð ¨eð ÀTð ÐV[×VbÑVbó ô*%˜Ÿ™ô %ôB—I‘Iô ô$˜"Ÿ)™)ô ô>˜2Ÿ9™9ô ô0(b—i‘iô (ôXb—i‘iô ôB-
˜Ÿ	™	ô -
ð` ô% ó %ó ð%ð, ô1
Ð/ó 1
ó ð1
ñh ðôôC
Ð'@ó C
óðC
ñL ðôôJ
Ð2°Mó J
óðJ
òZ ur(   