Я пытаюсь объединить все избыточные данные в один, сохранив при этом уникальную информацию о Джоне Смите и его уникальном идентификаторе.
Очевидно, что с ошибками при вводе данных, вызванными человеческим фактором (вице-президент и вице-президент и X-Corp/X Corporation), можно сделать очень мало, но как я могу объединить все эти данные в как можно меньшее количество строк без потери уникальных значений?
Как мне сократить 4 письма "john.smith@company.com" в одно, не затрагивая последующие данные в других столбцах? Или это невозможно, потому что они содержат разные значения в других полях?
Не лучше ли подойти к этому с помощью реляционной БД? Если да, то как мне построить?
Одним из способов подхода в Access было бы написать некоторый VBA, который берет поле идентификатора, а затем для каждого из других полей выбирает данные с наибольшим значением и записывает все это в новую таблицу. Однако, если ваши данные в таком беспорядке, вам придется потратить много времени на исправление этого, а затем разработать способ гарантировать, что он не попадет в такой беспорядок в будущем.
Привет Applecore, спасибо за комментарий. База данных от моей компании, мы переходим на новое программное обеспечение и должны очистить наши старые данные для переноса. БД, с которой я работаю, представляет собой объединенный список всех контактов нашей компании из всех мест. На данный момент мало что можно сделать с беспорядком данных, просто пытаюсь посмотреть, смогу ли я спасти и организовать большую часть из них. Я попробую метод Access, спасибо.
Вы также можете включить индикатор того, насколько часто «сохраняются» данные. Если он появляется в 6 из 7 случаев, то это, вероятно, хорошо (хотя 1 другой фрагмент данных может быть более новым и, следовательно, правильным). Если он появляется в 3 из 7 случаев, то он может быть не таким надежным и может нуждаться в проверке вручную.
Данные, с которыми я работаю (контактная информация), надежны и точны, если вы об этом. Основная проблема заключается в наличии более 10 строк для одного контакта, которые можно сжать в одну, заполнив пробелы и уменьшив дубликаты до одного значения.