huggingface
diff --git a/‎docs/source/_toctree.yml
Lines changed: 2 additions & 0 deletions b/‎docs/source/_toctree.yml
Lines changed: 2 additions & 0 deletions
diff --git a/‎examples/demo-site/src/index.html
Lines changed: 8 additions & 8 deletions b/‎examples/demo-site/src/index.html
Lines changed: 8 additions & 8 deletions
diff --git a/‎package.json
Lines changed: 1 addition & 1 deletion b/‎package.json
Lines changed: 1 addition & 1 deletion
diff --git a/‎scripts/convert.py
Lines changed: 9 additions & 10 deletions b/‎scripts/convert.py
Lines changed: 9 additions & 10 deletions
diff --git a/‎scripts/tasks.py renamed to ‎scripts/supported_models.py
Lines changed: 61 additions & 69 deletions b/‎scripts/tasks.py renamed to ‎scripts/supported_models.py
Lines changed: 61 additions & 69 deletions
@@ -29,6 +29,8 @@
     title: Tokenizers
   - local: api/processors
     title: Processors
+  - local: api/configs
+    title: Configs
   - local: api/env
     title: Environment variables
   - sections:
 
@@ -90,16 +90,16 @@ <h2 class="fw-bolder">Demo</h2>
                 Translation w/ t5-small (95 MB)
               </option>
               <option value="text-generation">
-                Text generation w/ distilgpt2 (250 MB)
+                Text generation w/ distilgpt2 (122 MB)
               </option>
               <option value="masked-language-modelling">
                 Masked language modelling w/ bert-base-cased (132 MB)
               </option>
               <option value="sequence-classification">
-                Text classification w/ bert-base-multilingual-uncased-sentiment (170 MB)
+                Text classification w/ bert-base-multilingual-uncased-sentiment (168 MB)
               </option>
               <option value="token-classification">
-                Token classification w/ Davlan/bert-base-multilingual-cased-ner-hrl (135 MB)
+                Token classification w/ Davlan/bert-base-multilingual-cased-ner-hrl (178 MB)
               </option>
               <option value="zero-shot-classification">
                 Zero-shot classification w/ typeform/distilbert-base-uncased-mnli (68 MB)
@@ -108,22 +108,22 @@ <h2 class="fw-bolder">Demo</h2>
                 Question answering w/ distilbert-base-uncased-distilled-squad (66 MB)
               </option>
               <option value="summarization">
-                Summarization w/ distilbart-cnn-6-6 (336 MB)
+                Summarization w/ distilbart-cnn-6-6 (335 MB)
               </option>
               <option value="code-completion">
-                Code completion w/ Salesforce/codegen-350M-mono (365 MB)
+                Code completion w/ Salesforce/codegen-350M-mono (369 MB)
               </option>
               <option value="automatic-speech-recognition">
                 Speech to text w/ whisper-tiny.en (61 MB)
               </option>
               <option value="image-to-text">
-                Image to text w/ vit-gpt2-image-captioning (622 MB)
+                Image to text w/ vit-gpt2-image-captioning (283 MB)
               </option>
               <option value="image-classification">
-                Image classification w/ google/vit-base-patch16-224 (91 MB)
+                Image classification w/ google/vit-base-patch16-224 (88 MB)
               </option>
               <option value="zero-shot-image-classification">
-                Zero-shot image classification w/ openai/clip-vit-base-patch16 (152 MB)
+                Zero-shot image classification w/ openai/clip-vit-base-patch16 (151 MB)
               </option>
               <!-- TODO: add image-segmentation demo -->
               <option value="object-detection">
 
@@ -9,7 +9,7 @@
     "typegen": "tsc ./src/transformers.js --allowJs --declaration --emitDeclarationOnly --declarationMap --outDir types",
     "dev": "webpack serve --no-client-overlay",
     "build": "webpack && npm run typegen",
-    "generate-tests": "python tests/generate_tests.py",
+    "generate-tests": "python -m tests.generate_tests",
     "test": "node --experimental-vm-modules node_modules/jest/bin/jest.js --verbose",
     "readme": "python ./docs/scripts/build_readme.py",
     "docs-api": "node ./docs/scripts/generate.js",
 
@@ -70,16 +70,10 @@ class ConversionArguments:
             "help": 'The device to use to do the export.'
         }
     )
-    merge_decoders: bool = field(
-        default=True,
-        metadata={
-            "help": "Whether to fuse decoder ONNX model and decoder with past ONNX model into one ONNX model with if logic"
-        }
-    )
-    overwrite: bool = field(
+    skip_validation: bool = field(
         default=False,
         metadata={
-            "help": "Whether to overwriting existing models"
+            "help": "Whether to skip validation of the converted model"
         }
     )
 
@@ -118,8 +112,10 @@ def quantize(model_names_or_paths):
             model_input=model,
             model_output=os.path.join(
                 directory_path, f'{file_name_without_extension}_quantized.onnx'),
-            per_channel=False,
-            reduce_range=False,
+
+            # TODO allow user to specify these or choose based on hardware
+            per_channel=True,
+            reduce_range=True,
 
             weight_type=weight_type,
             optimize_model=False,
@@ -185,6 +181,9 @@ def main():
         model_name_or_path=model_id,
         output=output_model_folder,
         task=conv_args.task,
+        opset=conv_args.opset,
+        device=conv_args.device,
+        do_validation=not conv_args.skip_validation,
     )
 
     # Step 2. (optional, recommended) quantize the converted model for fast inference and to reduce model size.
 
@@ -1,45 +1,19 @@
-from .extra.marian import SUPPORTED_HELSINKI_NLP_MODELS
-
-SUPPORTED_TASKS = {
-    # map tasks to automodels
-    'default': 'AutoModel',
-    'masked-lm': 'AutoModelForMaskedLM',
-    'causal-lm': 'AutoModelForCausalLM',
-    'seq2seq-lm': 'AutoModelForSeq2SeqLM',
-    'sequence-classification': 'AutoModelForSequenceClassification',
-    'token-classification': 'AutoModelForTokenClassification',
-    # 'multiple-choice': 'AutoModelForMultipleChoice',
-    'object-detection': 'AutoModelForObjectDetection',
-    'question-answering': 'AutoModelForQuestionAnswering',
-    'image-classification': 'AutoModelForImageClassification',
-    'image-segmentation': 'AutoModelForImageSegmentation',
-    # 'masked-im': 'AutoModelForMaskedImageModeling',
-    # 'semantic-segmentation': 'AutoModelForSemanticSegmentation',
-    'speech2seq-lm': 'AutoModelForSpeechSeq2Seq',
-    # 'audio-classification': 'AutoModelForAudioClassification',
-    # 'audio-frame-classification': 'AutoModelForAudioFrameClassification',
-    # 'audio-ctc': 'AutoModelForCTC',
-    # 'audio-xvector': 'AutoModelForAudioXVector',
-    'vision2seq-lm': 'AutoModelForVision2Seq',
-    # 'stable-diffusion': 'StableDiffusionPipeline',
-    'zero-shot-image-classification': 'AutoModelForZeroShotImageClassification',
-    'zero-shot-object-detection': 'AutoModelForZeroShotObjectDetection',
-}
+# from .extra.marian import SUPPORTED_HELSINKI_NLP_MODELS
 
 SUPPORTED_MODELS = {
-    'albert': {
+    'albert': [
         'albert-base-v2',
         'albert-large-v2',
         'sentence-transformers/paraphrase-albert-small-v2',
         'sentence-transformers/paraphrase-albert-base-v2',
-    },
+    ],
 
-    'bart': {
+    'bart': [
         'sshleifer/distilbart-cnn-6-6',
         'facebook/bart-large-cnn',
         'facebook/bart-large-mnli',
-    },
-    'bert': {
+    ],
+    'bert': [
         'bert-base-uncased',
         'bert-base-cased',
         'bert-base-multilingual-uncased',
@@ -63,26 +37,32 @@
         'ckiplab/bert-base-chinese-pos',
         'dslim/bert-base-NER',
         'dslim/bert-base-NER-uncased',
-    },
+
+        'allenai/scibert_scivocab_uncased',
+        'ProsusAI/finbert',
+        'emilyalsentzer/Bio_ClinicalBERT',
+        'SpanBERT/spanbert-large-cased',
+        'SpanBERT/spanbert-base-cased',
+    ],
     # TODO:
-    # 'blenderbot-small': {
+    # 'blenderbot-small': [
     #     'facebook/blenderbot_small-90M',
-    # },
-    'clip': {
+    # ],
+    'clip': [
         'openai/clip-vit-base-patch16',
         'openai/clip-vit-base-patch32',
-    },
-    'codegen': {
+    ],
+    'codegen': [
         'Salesforce/codegen-350M-mono',
         'Salesforce/codegen-350M-multi',
         'Salesforce/codegen-350M-nl',
-    },
-    'detr': {
+    ],
+    'detr': [
         'facebook/detr-resnet-50',
         'facebook/detr-resnet-101',
         'facebook/detr-resnet-50-panoptic',
-    },
-    'distilbert': {
+    ],
+    'distilbert': [
         'distilbert-base-uncased',
         'distilbert-base-cased',
         'distilbert-base-uncased-distilled-squad',
@@ -96,60 +76,64 @@
         'sentence-transformers/distilbert-base-nli-mean-tokens',
         'sentence-transformers/distilbert-base-nli-stsb-mean-tokens',
         'sentence-transformers/msmarco-distilbert-base-v4',
-    },
-    'gpt-neo': {
+    ],
+    'gpt-neo': [
         'EleutherAI/gpt-neo-125M',
         'MBZUAI/LaMini-Neo-125M',
-    },
-    'gpt2': {
+    ],
+    'gpt2': [
         'gpt2',
         'distilgpt2',
         'MBZUAI/LaMini-Cerebras-256M',
         'MBZUAI/LaMini-Cerebras-590M',
-    },
+        'MBZUAI/LaMini-GPT-124M',
+    ],
+    'm2m_100': [
+        'facebook/nllb-200-distilled-600M',
+    ],
     # TODO:
-    # 'marian': {
+    # 'marian': [
     #     f'Helsinki-NLP/opus-mt-{x}'
     #     for x in SUPPORTED_HELSINKI_NLP_MODELS
-    # },
-    'mobilebert': {
+    # ],
+    'mobilebert': [
         'typeform/mobilebert-uncased-mnli',
 
         # TODO:
         # https://github.com/huggingface/optimum/issues/1027
         # 'google/mobilebert-uncased',
-    },
-    'mpnet': {
+    ],
+    'mpnet': [
         'sentence-transformers/all-mpnet-base-v2',
         'sentence-transformers/nli-mpnet-base-v2',
         'sentence-transformers/paraphrase-mpnet-base-v2',
         'sentence-transformers/paraphrase-multilingual-mpnet-base-v2',
         'sentence-transformers/multi-qa-mpnet-base-cos-v1',
         'sentence-transformers/multi-qa-mpnet-base-dot-v1',
-    },
-    'mt5': {
+    ],
+    'mt5': [
         'google/mt5-small',
         'google/mt5-base',
-    },
-    'roberta': {
+    ],
+    'roberta': [
         'xlm-roberta-base',
         'roberta-base',
         'distilroberta-base',
         'roberta-large-mnli',
 
         'sentence-transformers/all-distilroberta-v1',
         'sentence-transformers/all-roberta-large-v1',
-    },
-    'sam': {
+    ],
+    'sam': [
         'facebook/sam-vit-base',
         'facebook/sam-vit-large',
         'facebook/sam-vit-huge',
-    },
-    'squeezebert': {
+    ],
+    'squeezebert': [
         'squeezebert/squeezebert-uncased',
         'squeezebert/squeezebert-mnli',
-    },
-    't5': {
+    ],
+    't5': [
         't5-small',
         't5-base',
         'google/t5-v1_1-small',
@@ -164,22 +148,30 @@
         'MBZUAI/LaMini-T5-61M',
         'MBZUAI/LaMini-T5-223M',
         'MBZUAI/LaMini-T5-738M',
-    },
-    'vision-encoder-decoder': {
+    ],
+    'vision-encoder-decoder': [
         'nlpconnect/vit-gpt2-image-captioning',
-    },
-    'vit': {
+    ],
+    'vit': [
         'google/vit-base-patch16-224-in21k',
         'google/vit-base-patch16-224',
-    },
-    'whisper': {
+        'facebook/dino-vitb16',
+        'facebook/dino-vits8',
+        'facebook/dino-vitb8',
+        'facebook/dino-vits16',
+    ],
+    'whisper': [
         'openai/whisper-tiny',
         'openai/whisper-tiny.en',
         'openai/whisper-base',
         'openai/whisper-base.en',
         'openai/whisper-small',
         'openai/whisper-small.en',
-    },
+        'openai/whisper-medium',
+        'openai/whisper-medium.en',
+        'openai/whisper-large',
+        'openai/whisper-large-v2',
+    ],
 }