dataset_partition_prep Module

Bevat functionaliteit voor het opgeven van de partitievoorbereiding van de gegevensset.

Partitievoorbereiding vindt automatisch plaats wanneer u een opendatasets klasse gebruikt waarvoor een partitie van gegevens is vereist, zoals de NycTlcGreen klasse.

Functies

prep_partition_datetime

Partitiepad voorbereiden 'year=\d+/month=\d+/'.

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

Parameters

Name Description
dflow
Vereist
<xref:azureml.dataprep.Dataflow>

Een exemplaar van dataprep. Gegevensstroom.

start_date
Vereist

De begindatum van de gegevensset.

end_date
Vereist

De einddatum van de gegevensset.

pattern
Vereist

Het datum/tijd-patroon.

prep_partition_puYear_puMonth

Partitiepad voorbereiden 'year=\d+/month=\d+/'.

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

Parameters

Name Description
dflow
Vereist
<xref:azureml.dataprep.Dataflow>

Een exemplaar van dataprep. Gegevensstroom.

start_date
Vereist

De begindatum van de gegevensset.

end_date
Vereist

De einddatum van de gegevensset.

pattern
Vereist

Het datum/tijd-patroon.

Keyword-Only Parameters

Name Description
pattern
Default value: ['puYear', 'puMonth']

prep_partition_year

Partitiepad voorbereiden 'year=\d+/month=\d+/'.

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

Parameters

Name Description
dflow
Vereist
<xref:azureml.dataprep.Dataflow>

Een exemplaar van dataprep. Gegevensstroom.

start_date
Vereist

De begindatum van de gegevensset.

end_date
Vereist

De einddatum van de gegevensset.

pattern
Vereist

Het datum/tijd-patroon.

Keyword-Only Parameters

Name Description
pattern
Default value: ['year']

prep_partition_year_month

Partitiepad voorbereiden 'year=\d+/month=\d+/'.

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

Parameters

Name Description
dflow
Vereist
<xref:azureml.dataprep.Dataflow>

Een exemplaar van dataprep. Gegevensstroom.

start_date
Vereist

De begindatum van de gegevensset.

end_date
Vereist

De einddatum van de gegevensset.

pattern
Vereist

Het datum/tijd-patroon.

Keyword-Only Parameters

Name Description
pattern
Default value: ['year', 'month']

prep_partition_year_month_day

Partitiepad voorbereiden 'year=\d+/month=\d+/'.

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

Parameters

Name Description
dflow
Vereist
<xref:azureml.dataprep.Dataflow>

Een exemplaar van dataprep. Gegevensstroom.

start_date
Vereist

De begindatum van de gegevensset.

end_date
Vereist

De einddatum van de gegevensset.

pattern
Vereist

Het datum/tijd-patroon.

Keyword-Only Parameters

Name Description
pattern
Default value: ['year', 'month', 'day']