Намиране и премахване на дубликати в Excel - най -доброто ръководство

Гледайте видео - Как да намерите и премахнете дубликати в Excel

С много данни … идват много дублирани данни.

Дубликатите в Excel могат да причинят много проблеми. Независимо дали импортирате данни от база данни, получавате ги от колега или ги събирате сами, дублираните данни винаги могат да се прокраднат. И ако данните, с които работите, са огромни, тогава става наистина трудно да се намерят и премахнат тези дубликати в Excel .

В този урок ще ви покажа как да намерите и премахнете дубликати в Excel.

СЪДЪРЖАНИЕ:

  1. FIND и HIGHLIGHT Дубликати в Excel.
    • Намерете и маркирайте дубликати в една колона.
    • Намерете и маркирайте дубликати в множество колони.
    • Намерете и маркирайте дублирани редове.
  2. ОТСТРАНЯВАНЕ на дубликати в Excel.
    • Премахване на дубликати от една колона.
    • Премахване на дубликати от няколко колони.
    • Премахнете дублиращите се редове.

Намерете и маркирайте дубликати в Excel

Дубликатите в Excel могат да се предлагат в много форми. Можете да го имате в една колона или в няколко колони. Възможно е също така да има дублиране на цял ред.

Намиране и маркиране на дубликати в една колона в Excel

Условното форматиране улеснява подчертаването на дубликати в Excel.

Ето как да го направите:

  • Изберете данните, в които искате да подчертаете дубликатите.

  • Отидете на Начало -> Условно форматиране -> Правила за маркиране на клетки -> Дублирани стойности.

  • В диалоговия прозорец Дублирани стойности изберете Дублиране в падащото меню вляво и посочете формата, в който искате да маркирате дублиращите се стойности. Можете да избирате от готовите опции за формат (в падащото меню вдясно) или да посочите свой собствен формат.

  • Това ще подчертае всички стойности, които имат дубликати.

Бърз съвет: Не забравяйте да проверите за водещи или задни пространства. Например „Джон“ и „Джон“ се считат за различни, тъй като последният има допълнителен интервал в него. Добра идея би била да използвате функцията TRIM за почистване на вашите данни.

Намиране и маркиране на дубликати в множество колони в Excel

Ако имате данни, които обхващат множество колони и трябва да потърсите дубликати в тях, процесът е абсолютно същият като по -горе.

Ето как да го направите:

  • Изберете данните.
  • Отидете на Начало -> Условно форматиране -> Правила за маркиране на клетки -> Дублирани стойности.
  • В диалоговия прозорец Дублирани стойности изберете Дублиране в падащото меню вляво и посочете формата, в който искате да маркирате дублиращите се стойности.
  • Това ще подчертае всички клетки, които имат дублирани стойности в избрания набор от данни.

Намиране и маркиране на дублирани редове в Excel

Намирането на дублирани данни и намирането на дублиращи се редове от данни са 2 различни неща. Погледни:

Намирането на дублирани редове е малко по -сложно от намирането на дублирани клетки.

Ето стъпките:

  • В съседна колона използвайте следната формула:
    = A2 & B2 & C2 & D2
    Плъзнете това надолу за всички редове. Тази формула комбинира всички стойности на клетката като един низ. (Можете също да използвате функцията CONCATENATE за комбиниране на текстови низове)

По този начин създадохме по един низ за всеки ред. Ако в този набор от данни има дублирани редове, тогава тези низове ще бъдат абсолютно еднакви за него.

Сега, когато имаме комбинираните низове за всеки ред, можем да използваме условно форматиране, за да подчертаем дублиращи се низове. Маркираният низ означава, че редът има дубликат.

Ето стъпките за подчертаване на дублиращи се низове:

  • Изберете диапазона, който има комбинирани низове (E2: E16 в този пример).
  • Отидете на Начало -> Условно форматиране -> Правила за маркиране на клетки -> Дублирани стойности.
  • В диалоговия прозорец Дублирани стойности се уверете, че е избрано Duplicate и след това посочете цвета, в който искате да подчертаете дублиращите се стойности.

Това ще подчертае дублиращите се стойности в колона Е.

В горния подход сме подчертали само низовете, които сме създали.

Но какво, ако искате да маркирате всички дублирани редове (вместо да маркирате клетки в една колона)?

Ето стъпките за подчертаване на дублиращи се редове:

  • В съседна колона използвайте следната формула:
    = A2 & B2 & C2 & D2
    Плъзнете това надолу за всички редове. Тази формула комбинира всички стойности на клетката като един низ.

  • Изберете данните A2: D16.
  • С избраните данни отидете на Начало -> Условно форматиране -> Ново правило.

  • В диалоговия прозорец „Ново правило за форматиране“ щракнете върху „Използвайте формула, за да определите кои клетки да форматирате“.
  • В полето по -долу използвайте следната функция COUNTIF:
    = COUNTIF ($ E $ 2: $ E $ 16, $ E2)> 1

  • Изберете формата и щракнете върху OK.

Тази формула ще подчертае всички редове, които имат дубликат.

Премахване на дубликати в Excel

В горния раздел научихме как да намираме и подчертаваме дубликати в Excel. В този раздел ще ви покажа как да се отървете от тези дубликати.

Премахване на дубликати от една колона в Excel

Ако имате данни в една колона и искате да премахнете всички дубликати, ето стъпките:

  • Изберете данните.
  • Отидете на Данни -> Инструменти за данни -> Премахване на дубликати.
  • В диалоговия прозорец Премахване на дубликати:
    • Ако вашите данни имат заглавки, уверете се, че е поставена отметка в опцията „Моите данни имат заглавки“.
    • Уверете се, че колоната е избрана (в този случай има само една колона).

  • Щракнете върху OK.

Това ще премахне всички дублирани стойности от колоната и ще имате само уникалните стойности.

ВНИМАНИЕ: Това променя вашия набор от данни, като премахва дубликати. Уверете се, че имате резервно копие на оригиналния набор от данни. Ако искате да извлечете уникалните стойности на друго място, копирайте този набор от данни на това място и след това използвайте гореспоменатите стъпки. Като алтернатива можете също да използвате Advanced Filter, за да извлечете уникални стойности на друго място.

Премахване на дубликати от няколко колони в Excel

Да предположим, че имате данните, както е показано по -долу:

В горните данни ред #2 и #16 имат абсолютно същите данни за представител на продажбите, регион и сума, но различни дати (същото е случаят с ред #10 и #13). Това може да е грешка при въвеждане, когато един и същ запис е записан два пъти с различни дати.

За да изтриете дублиращия се ред в този случай:

  • Изберете данните.
  • Отидете на Данни -> Инструменти за данни -> Премахване на дубликати.
  • В диалоговия прозорец Премахване на дубликати:
    • Ако вашите данни имат заглавки, уверете се, че е поставена отметка в опцията „Моите данни имат заглавки“.
    • Изберете всички колони с изключение на колоната Дата.

  • Щракнете върху OK.

Това ще премахне 2 дублирани записа.

ЗАБЕЛЕЖКА: Това запазва първото събитие и премахва всички останали дублирани събития.

Премахнете дублиращите се редове в Excel

За да изтриете дублиращи се редове, ето стъпките:

  • Изберете всички данни.
  • Отидете на Данни -> Инструменти за данни -> Премахване на дубликати.
  • В диалоговия прозорец Премахване на дубликати:
    • Ако вашите данни имат заглавки, уверете се, че е поставена отметка в опцията „Моите данни имат заглавки“.
    • Изберете всички колони.

  • Щракнете върху OK.

Използвайте гореспоменатите техники, за да почистите данните си и да се отървете от дубликатите.

Може да харесате и следните уроци по Excel:

  • 10 начина за почистване на данни в електронни таблици на Excel.
  • Премахнете водещите и задните пространства в Excel.
  • 24 ежедневни проблеми с Excel и техните бързи поправки.
  • Как да намерите обединени клетки в Excel.

Така ще помогнете за развитието на сайта, сподели с приятелите си

wave wave wave wave wave