sklearn.metrics.jaccard_score ¶

sklearn.metrics.jaccard_score(y_true, y_pred, *, labels=Nenhum, pos_label=1, average=’binary’, sample_weight=Nenhum, zero_division=’warn’)¶

Jaccard similarity coefficient score.

O índice Jaccard , ou coeficiente de similaridade Jaccard, definido pelo tamanho da intersecção dividida pelo tamanho da união de dois conjuntos de etiquetas, é usado para comparar o conjunto de etiquetas previstas para uma amostra com o conjunto de etiquetas correspondentes em y_true.

Ler mais no Guia do Usuário.

Parâmetros do tipo array-like y_true1d, ou matriz indicadora de etiqueta / matriz esparsa

Rótulos de verdade (corretos).

Array-like y_pred1d, ou matriz indicadora de array / matriz esparsa

Rótulos previstos, como retornados por um classificador.

Rótulos de forma (n_classes,), padrão=Nenhum

O conjunto de rótulos a incluir quando average != 'binary', e sua ordem se average is None. As etiquetas presentes nos dados podem ser excluídas, por exemplo para calcular uma média multiclasse ignorando a classe negativa amajority, enquanto que as etiquetas não presentes nos dados irão resultar em 0 componentes em uma média macro. Para alvos com vários rótulos, os rótulos são índices de colunas. Por padrão, todos os rótulos em y_true ey_pred são usados em ordem ordenada.

pos_labelstr ou int, padrão=1

A classe a relatar se average='binary' e os dados são binários.Se os dados forem multiclasse ou multilabel, isto será ignorado;definindo labels= e average != 'binary' serão reportados apenas os resultados para aquela etiqueta.

média{Nenhum, ‘micro’, ‘macro’, ‘samples’, ‘ponderado’, ‘binário’}, padrão=’binário’

Se None, as pontuações para cada classe são retornadas. Caso contrário, isto determina o tipo de média executada nos dados:

'binary':

Apenas relate resultados para a classe especificada por pos_label.Isto só é aplicável se os alvos (y_{true,pred}) forem binários.

'micro':

Calcule métricas globalmente contando o total de verdadeiros positivos, falsos negativos e falsos positivos.

'macro':

Calcule as métricas para cada etiqueta, e encontre o seu significado não ponderado. Isto não leva em conta o desequilíbrio das etiquetas.

'weighted':

Calcular métricas para cada etiqueta, e encontrar a sua média, ponderada por suporte (o número de instâncias verdadeiras para cada etiqueta). Estealtera ‘macro’ para contabilizar o desequilíbrio de etiqueta.

'samples':

Calcular métricas para cada instância, e encontrar a sua média (apenas significando para a classificação multilabel).

amostra_weightarray-like of shape (n_samples,), default=Nenhum

Pesos de amostra.

zero_divisão “warn”, {0.0, 1.0}, default=”warn”

Configura o valor a retornar quando há uma divisão zero, ou seja, quando não há valores negativos nas previsões e etiquetas. Se definido como “warn”, isto age como 0, mas um aviso também é elevado.

Retorna scorefloat (se a média não for None) ou array de flutuadores, forma =

Veja também

accuracy_score, f_score, multilabel_confusion_matrix

Notes

jaccard_score pode ser uma métrica pobre se houver nopositivos para algumas amostras ou classes. Jaccard é indefinido se houver areno true ou etiquetas previstas, e nossa implementação retornará um scoreof 0 com um aviso.

1

Entrada Wikipedia para o índice Jaccard.

Exemplos

>>> import numpy as np>>> from sklearn.metrics import jaccard_score>>> y_true = np.array(,... ])>>> y_pred = np.array(,... ])

No caso binário:

>>> jaccard_score(y_true, y_pred)0.6666...

No caso multilabel:

>

>>> jaccard_score(y_true, y_pred, average='samples')0.5833...>>> jaccard_score(y_true, y_pred, average='macro')0.6666...>>> jaccard_score(y_true, y_pred, average=None)array()

No caso multiclasse:

>>> y_pred = >>> y_true = >>> jaccard_score(y_true, y_pred, average=None)array()

>

Exemplos usando sklearn.metrics.jaccard_score¶

Deixe uma resposta

O seu endereço de email não será publicado.