Normalització és bo per utilitzar quan sabeu que la distribució de les vostres dades no segueix una distribució gaussiana. … L'estandardització, d' altra banda, pot ser útil en els casos en què les dades segueixen una distribució gaussiana.
He d'utilitzar la normalització o l'estandardització?
La normalització és útil quan les vostres dades tenen escales diferents i l'algoritme que utilitzeu no fa suposicions sobre la distribució de les vostres dades, com ara k-veïns més propers i xarxes neuronals artificials. Estandardització suposa que les vostres dades tenen una distribució gaussiana (corba de campana).
L'estandardització és el mateix que la normalització?
Al món empresarial, "normalització" normalment significa que l'interval de valors es "normalitza a partir de 0". De 0 a 1,0". "Estandardització" normalment significa que l'interval de valors està "estandarditzat" per mesurar quantes desviacions estàndard té el valor respecte a la seva mitjana.
Sempre és bo normalitzar les dades?
En normalitzar, en realitat esteu llençant informació sobre les dades, com ara els valors màxims i mínims absoluts. Per tant, no hi ha cap regla general. Com deien altres, la normalització no sempre és aplicable; per exemple. des d'un punt de vista pràctic.
Quan no hauríeu de normalitzar les dades?
Algunes bones raons per no normalitzar
- Les unions són cares. Normalitzar la vostra base de dades sovint implica crear moltes taules. …
- El disseny normalitzat és difícil. …
- Quick and brut ha de ser ràpid i brut. …
- Si utilitzeu una base de dades NoSQL, la normalització tradicional no és desitjable.