Как выполнить перенос обучения, т. е. взять предварительно обученную модель Spacy NER и заставить ее изучать новые объекты, характерные для моего варианта использования?
Для этого у меня есть 100 новых аннотированных обучающих выборок. Новая переобученная модель должна предсказывать только новые объекты, а не какие-либо из существующих объектов в предварительно обученной пространственной модели. Простое добавление/обновление новых объектов в существующие модели и игнорирование старых объектов во время прогнозирования не имеет смысла.
Этот официальный пример описывает, как добавлять новые объекты к существующим предварительно обученным объектам, но это не то, что мне нужно. У меня также есть очень мало примеров, т. е. 100, чтобы полностью построить новую модель NER с нуля.
Изменить: я хочу идентифицировать все номера счетов в неструктурированном документе.
Пример («Я хотел бы изменить адрес, соответствующий моей учетной записи 12345. Пожалуйста, дайте мне знать, как это сделать». [34, 39, 'номер учетной записи'])
Нужна дополнительная информация, чтобы ответить на вопрос, с какими типами объектов вы работаете? Названия мест, имена людей и т.д.? Можете ли вы привести пример новых сущностей и обучающих данных для них?
Спасибо. Добавлено в пост