Main Content

Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

excludedata

Excluya datos del ajuste

Descripción

ejemplo

tf = excludedata(x,y,'box',box) devuelve un arreglo lógico que indica qué elementos están fuera del cuadro en el plano xy especificado por box. Los elementos de tf equivalen a 1 para los puntos de datos fuera del cuadro y a 0 para los que están dentro. Para excluir datos al ajustar una curva con fit, especifique tf como valor 'Exclude'.

ejemplo

tf = excludedata(x,y,'domain',domain) identifica puntos de datos que tienen valores x fuera del intervalo domain.

ejemplo

tf = excludedata(x,y,'range',range) identifica puntos de datos con valores y fuera del intervalo range.

tf = excludedata(x,y,'indices',indices) identifica puntos de datos con índices iguales a indices.

Ejemplos

contraer todo

Visualice reglas de exclusión con datos aleatorios.

Genere datos aleatorios x e y.

xdata = -3 + 6*rand(1,1e4);
ydata = -3 + 6*rand(1,1e4);

Como ejemplo, excluya datos que están dentro del cuadro [-1 1 -1 1] o fuera del dominio [-2 2].

outliers1 = ~excludedata(xdata,ydata,'box',[-1 1 -1 1]);
outliers2 = excludedata(xdata,ydata,'domain',[-2 2]);
outliers = outliers1|outliers2;

Represente los datos que no están excluidos. El área blanca corresponde a las regiones excluidas.

plot(xdata(~outliers),ydata(~outliers),'.')
axis([-3 3 -3 3])
axis square

Cargue el recuento de votos y los nombres de los condados del estado de Florida en las elecciones presidenciales estadounidenses de 2000.

load flvote2k

Utilice el recuento de votos de los candidatos de los dos partidos principales, Bush y Gore, como predictores del recuento de votos para el candidato del tercer partido, Buchanan, y represente las dispersiones:

plot(bush,buchanan,'rs')
hold on
plot(gore,buchanan,'bo')
legend('Bush data','Gore data')

Asuma un modelo en el que una proporción fija de los votantes de Bush o de Gore eligen votar a Buchanan.

f = fittype({'x'})
f = 
     Linear model:
     f(a,x) = a*x

Excluya los datos de los votantes por correo, que no utilizaron la polémica papeleta "mariposa".

nobutterfly = strcmp(counties,'Absentee Ballots');

Realice un ajuste robusto de ponderación bicuadrada del modelo a los dos conjuntos de datos, excluyendo los votantes por correo.

bushfit = fit(bush,buchanan,f,'Exclude',nobutterfly,'Robust','on');
gorefit = fit(gore,buchanan,f,'Exclude',nobutterfly,'Robust','on');

Los ajustes robustos otorgan una ponderación baja a los valores atípicos, por lo que los valores residuales grandes de un ajuste robusto se pueden utilizar para identificar los valores atípicos.

figure
plot(bushfit,bush,buchanan,'rs','residuals')
hold on
plot(gorefit,gore,buchanan,'bo','residuals')

Calcule los valores residuales.

bushres = buchanan - feval(bushfit,bush);
goreres = buchanan - feval(gorefit,gore);

Identifique los valores residuales grandes como aquellos fuera del rango [-500 500].

bushoutliers = excludedata(bush,bushres,'range',[-500 500]);
goreoutliers = excludedata(gore,goreres,'range',[-500 500]);

Muestre los condados correspondientes a los valores atípicos. Los condados de Miami-Dade y Broward se corresponden con los mayores valores predictores. El condado de Palm Beach, el único del estado que utilizó las papeletas "mariposa", corresponde a los mayores valores residuales.

counties(bushoutliers)
ans = 2x1 cell
    {'Miami-Dade'}
    {'Palm Beach'}

counties(goreoutliers)
ans = 3x1 cell
    {'Broward'   }
    {'Miami-Dade'}
    {'Palm Beach'}

Argumentos de entrada

contraer todo

Sitios de datos de valores de datos especificados como un vector numérico.

Valores de datos especificados como un vector numérico.

Cuadro fuera del cual encontrar datos, especificado como un vector numérico [xmin xmax ymin ymax] con cuatro elementos.

Ejemplo: [-1 1 0 2]

Dominio fuera del cual encontrar datos, especificado como un vector numérico [xmin xmax] con dos elementos.

Ejemplo: [-1 1]

Dominio fuera del cual encontrar datos, especificado como un vector numérico [ymin ymax] con dos elementos.

Ejemplo: [3 4]

Índices de puntos de datos que buscar, especificados como vector numérico.

Ejemplo: [3 7 9]

Consulte también

|

Introducido antes de R2006a