BitFit: Simple Parameter-efficient Fine-tuning for Transformer-based Masked Language-models

Résumés déjà disponibles dans d'autres langues : en

Auteurs : Elad Ben Zaken, Shauli Ravfogel, Yoav Goldberg

Accepted at ACL 2022 main conference

Résumé : We introduce BitFit, a sparse-finetuning method where only the bias-terms of the model (or a subset of them) are being modified. We show that with small-to-medium training data, applying BitFit on pre-trained BERT models is competitive with (and sometimes better than) fine-tuning the entire model. For larger data, the method is competitive with other sparse fine-tuning methods. Besides their practical utility, these findings are relevant for the question of understanding the commonly-used process of finetuning: they support the hypothesis that finetuning is mainly about exposing knowledge induced by language-modeling training, rather than learning new task-specific linguistic knowledge.

Soumis à arXiv le 18 Jui. 2021

Posez des questions sur cet article à notre assistant IA

Vous pouvez aussi discutez avec plusieurs papiers à la fois ici.

Instructions pour utiliser l'assistant IA ?

Résultats du processus de synthèse de l'article arXiv : 2106.10199v5

Résumé Complet
Points clés
Résumé vulgarisé
Article de blog

Le résumé n'est pas encore prêt

Les points clés ne sont pas encore prêts

Le résumé vulgarisé n'est pas encore prêt

L'article de blog n'est pas encore prêt

Créé le 29 Aoû. 2024

Disponible dans d'autres langues : en

Évaluez la qualité du contenu généré par l'IA en votant

Note : 0

Le résumé précédent a été créé il y a plus d'un an et peut être réexécuté (si nécessaire) en cliquant sur le bouton Exécuter ci-dessous.

BitFit: Simple Parameter-efficient Fine-tuning for Transformer-based Masked Language-models

Posez des questions sur cet article à notre assistant IA

Résultats du processus de synthèse de l'article arXiv : 2106.10199v5

Articles similaires résumés avec nos outils d'IA