GispoCoding · msorvoja · Nov 13, 2024 · Nov 14, 2024 · Nov 14, 2024 · Nov 14, 2024
diff --git a/eis_toolkit/cli.py b/eis_toolkit/cli.py
@@ -3076,8 +3076,10 @@ def gamma_overlay_cli(input_rasters: INPUT_FILES_ARGUMENT, output_raster: OUTPUT
 def alr_transform_cli(
     input_vector: INPUT_FILE_OPTION,
     output_vector: OUTPUT_FILE_OPTION,
-    column: str = None,
+    columns: Annotated[List[str], typer.Option()] = None,
+    denominator_column: str = None,
     keep_denominator_column: bool = False,
+    scale: Optional[float] = None,
 ):
     """Perform an additive logratio transformation on the data."""
     from eis_toolkit.transformations.coda.alr import alr_transform
@@ -3089,7 +3091,13 @@ def alr_transform_cli(
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_df = alr_transform(df=df, column=column, keep_denominator_column=keep_denominator_column)
+    out_df = alr_transform(
+        df=df,
+        columns=columns,
+        denominator_column=denominator_column,
+        keep_denominator_column=keep_denominator_column,
+        scale=scale,
+    )
     typer.echo("Progess 75%")
 
     out_gdf = gpd.GeoDataFrame(out_df, geometry=geometries)
@@ -3104,6 +3112,7 @@ def inverse_alr_transform_cli(
     input_vector: INPUT_FILE_OPTION,
     output_vector: OUTPUT_FILE_OPTION,
     denominator_column: str = typer.Option(),
+    columns: Annotated[List[str], typer.Option()] = None,
     scale: float = 1.0,
 ):
     """Perform the inverse transformation for a set of ALR transformed data."""
@@ -3116,7 +3125,7 @@ def inverse_alr_transform_cli(
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_df = inverse_alr(df=df, denominator_column=denominator_column, scale=scale)
+    out_df = inverse_alr(df=df, denominator_column=denominator_column, columns=columns, scale=scale)
     typer.echo("Progess 75%")
 
     out_gdf = gpd.GeoDataFrame(out_df, geometry=geometries)
@@ -3127,7 +3136,12 @@ def inverse_alr_transform_cli(
 
 # CODA - CLR TRANSFORM
 @app.command()
-def clr_transform_cli(input_vector: INPUT_FILE_OPTION, output_vector: OUTPUT_FILE_OPTION):
+def clr_transform_cli(
+    input_vector: INPUT_FILE_OPTION,
+    output_vector: OUTPUT_FILE_OPTION,
+    columns: Annotated[List[str], typer.Option()] = None,
+    scale: Optional[float] = None,
+):
     """Perform a centered logratio transformation on the data."""
     from eis_toolkit.transformations.coda.clr import clr_transform
 
@@ -3138,7 +3152,7 @@ def clr_transform_cli(input_vector: INPUT_FILE_OPTION, output_vector: OUTPUT_FIL
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_df = clr_transform(df=df)
+    out_df = clr_transform(df=df, columns=columns, scale=scale)
     typer.echo("Progess 75%")
 
     out_gdf = gpd.GeoDataFrame(out_df, geometry=geometries)
@@ -3152,6 +3166,7 @@ def clr_transform_cli(input_vector: INPUT_FILE_OPTION, output_vector: OUTPUT_FIL
 def inverse_clr_transform_cli(
     input_vector: INPUT_FILE_OPTION,
     output_vector: OUTPUT_FILE_OPTION,
+    columns: Annotated[List[str], typer.Option()] = None,
     colnames: Annotated[List[str], typer.Option()] = None,
     scale: float = 1.0,
 ):
@@ -3165,7 +3180,7 @@ def inverse_clr_transform_cli(
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_df = inverse_clr(df=df, colnames=colnames, scale=scale)
+    out_df = inverse_clr(df=df, columns=columns, colnames=colnames, scale=scale)
     typer.echo("Progess 75%")
 
     out_gdf = gpd.GeoDataFrame(out_df, geometry=geometries)
@@ -3181,6 +3196,7 @@ def single_ilr_transform_cli(
     output_vector: OUTPUT_FILE_OPTION,
     subcomposition_1: Annotated[List[str], typer.Option()],
     subcomposition_2: Annotated[List[str], typer.Option()],
+    scale: Optional[float] = None,
 ):
     """Perform a single isometric logratio transformation on the provided subcompositions."""
     from eis_toolkit.transformations.coda.ilr import single_ilr_transform
@@ -3192,7 +3208,9 @@ def single_ilr_transform_cli(
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_series = single_ilr_transform(df=df, subcomposition_1=subcomposition_1, subcomposition_2=subcomposition_2)
+    out_series = single_ilr_transform(
+        df=df, subcomposition_1=subcomposition_1, subcomposition_2=subcomposition_2, scale=scale
+    )
     typer.echo("Progess 75%")
 
     # NOTE: Output of pairwise_logratio might be changed to DF in the future, to automatically do the following
@@ -3237,7 +3255,9 @@ def pairwise_logratio_cli(
 def single_plr_transform_cli(
     input_vector: INPUT_FILE_OPTION,
     output_vector: OUTPUT_FILE_OPTION,
-    column: str = typer.Option(),
+    numerator: str = typer.Option(),
+    denominator_columns: Annotated[List[str], typer.Option()] = None,
+    scale: Optional[float] = None,
 ):
     """Perform a pivot logratio transformation on the selected column."""
     from eis_toolkit.transformations.coda.plr import single_plr_transform
@@ -3249,7 +3269,7 @@ def single_plr_transform_cli(
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_series = single_plr_transform(df=df, column=column)
+    out_series = single_plr_transform(df=df, numerator=numerator, denominator_columns=denominator_columns, scale=scale)
     typer.echo("Progess 75%")
 
     # NOTE: Output of single_plr_transform might be changed to DF in the future, to automatically do the following
@@ -3262,8 +3282,13 @@ def single_plr_transform_cli(
 
 # CODA - PLR TRANSFORM
 @app.command()
-def plr_transform_cli(input_vector: INPUT_FILE_OPTION, output_vector: OUTPUT_FILE_OPTION):
-    """Perform a pivot logratio transformation on the dataframe, returning the full set of transforms."""
+def plr_transform_cli(
+    input_vector: INPUT_FILE_OPTION,
+    output_vector: OUTPUT_FILE_OPTION,
+    columns: Annotated[List[str], typer.Option()] = None,
+    scale: Optional[float] = None,
+):
+    """Perform a pivot logratio transformation on the selected columns."""
     from eis_toolkit.transformations.coda.plr import plr_transform
 
     typer.echo("Progress: 10%")
@@ -3273,7 +3298,7 @@ def plr_transform_cli(input_vector: INPUT_FILE_OPTION, output_vector: OUTPUT_FIL
     df = pd.DataFrame(gdf.drop(columns="geometry"))
     typer.echo("Progress: 25%")
 
-    out_df = plr_transform(df=df)
+    out_df = plr_transform(df=df, columns=columns, scale=scale)
     typer.echo("Progess 75%")
 
     out_gdf = gpd.GeoDataFrame(out_df, geometry=geometries)

diff --git a/eis_toolkit/transformations/coda/alr.py b/eis_toolkit/transformations/coda/alr.py
@@ -1,88 +1,125 @@
-from numbers import Number
-
-import numpy as np
-import pandas as pd
-from beartype import beartype
-from beartype.typing import Optional, Sequence
-
-from eis_toolkit.exceptions import InvalidColumnException, NumericValueSignException
-from eis_toolkit.utilities.aitchison_geometry import _closure
-from eis_toolkit.utilities.checks.compositional import check_in_simplex_sample_space
-from eis_toolkit.utilities.miscellaneous import rename_columns_by_pattern
-
-
-@beartype
-def _alr_transform(df: pd.DataFrame, columns: Sequence[str], denominator_column: str) -> pd.DataFrame:
-
-    ratios = df[columns].div(df[denominator_column], axis=0)
-    return np.log(ratios)
-
-
-@beartype
-def alr_transform(
-    df: pd.DataFrame, column: Optional[str] = None, keep_denominator_column: bool = False
-) -> pd.DataFrame:
-    """
-    Perform an additive logratio transformation on the data.
-
-    Args:
-        df: A dataframe of compositional data.
-        column: The name of the column to be used as the denominator column.
-        keep_denominator_column: Whether to include the denominator column in the result. If True, the returned
-            dataframe retains its original shape.
-
-    Returns:
-        A new dataframe containing the ALR transformed data.
-
-    Raises:
-        InvalidColumnException: The input column isn't found in the dataframe.
-        InvalidCompositionException: Data is not normalized to the expected value.
-        NumericValueSignException: Data contains zeros or negative values.
-    """
-    check_in_simplex_sample_space(df)
-
-    if column is not None and column not in df.columns:
-        raise InvalidColumnException(f"The column {column} was not found in the dataframe.")
-
-    column = column if column is not None else df.columns[-1]
-
-    columns = [col for col in df.columns]
-
-    if not keep_denominator_column and column in columns:
-        columns.remove(column)
-
-    return rename_columns_by_pattern(_alr_transform(df, columns, column))
-
-
-@beartype
-def _inverse_alr(df: pd.DataFrame, denominator_column: str, scale: Number = 1.0) -> pd.DataFrame:
-    dfc = df.copy()
-
-    if denominator_column not in dfc.columns.values:
-        # Add the denominator column
-        dfc[denominator_column] = 0.0
-
-    return _closure(np.exp(dfc), scale)
-
-
-@beartype
-def inverse_alr(df: pd.DataFrame, denominator_column: str, scale: Number = 1.0) -> pd.DataFrame:
-    """
-    Perform the inverse transformation for a set of ALR transformed data.
-
-    Args:
-        df: A dataframe of ALR transformed compositional data.
-        denominator_column: The name of the denominator column.
-        scale: The value to which each composition should be normalized. Eg., if the composition is expressed
-            as percentages, scale=100.
-
-    Returns:
-        A dataframe containing the inverse transformed data.
-
-    Raises:
-        NumericValueSignException: The input scale value is zero or less.
-    """
-    if scale <= 0:
-        raise NumericValueSignException("The scale value should be positive.")
-
-    return _inverse_alr(df, denominator_column, scale)
+from numbers import Number
+
+import numpy as np
+import pandas as pd
+from beartype import beartype
+from beartype.typing import Optional, Sequence
+
+from eis_toolkit.exceptions import InvalidColumnException, NumericValueSignException
+from eis_toolkit.utilities.aitchison_geometry import _closure
+from eis_toolkit.utilities.checks.compositional import check_in_simplex_sample_space
+from eis_toolkit.utilities.miscellaneous import rename_columns_by_pattern
+
+
+@beartype
+def _alr_transform(df: pd.DataFrame, columns: Sequence[str], denominator_column: str) -> pd.DataFrame:
+
+    ratios = df[columns].div(df[denominator_column], axis=0)
+    return np.log(ratios)
+
+
+@beartype
+def alr_transform(
+    df: pd.DataFrame,
+    columns: Optional[Sequence[str]] = None,
+    denominator_column: Optional[str] = None,
+    keep_denominator_column: bool = False,
+    scale: Optional[Number] = None,
+) -> pd.DataFrame:
+    """
+    Perform an additive logratio transformation on the data.
+
+    Args:
+        df: A dataframe of compositional data.
+        columns: The names of the columns to be transformed.
+        denominator_column: The name of the column to be used as the denominator column.
+        keep_denominator_column: Whether to include the denominator column in the result. If True, the returned
+            dataframe retains its original shape.
+        scale: The value to which each composition should be normalized. Eg., if the composition is expressed
+            as percentages, scale=100. Closure is not performed by default.
+
+    Returns:
+        A new dataframe containing the ALR transformed data.
+
+    Raises:
+        InvalidColumnException: The input column isn't found in the dataframe.
+        InvalidCompositionException: Data is not normalized to the expected value.
+        NumericValueSignException: Data contains zeros or negative values.
+    """
+
+    if denominator_column is not None and denominator_column not in df.columns:
+        raise InvalidColumnException(f"The column {denominator_column} was not found in the dataframe.")
+
+    if denominator_column is not None and keep_denominator_column and columns and denominator_column not in columns:
+        raise InvalidColumnException(
+            f"Denominator column '{denominator_column}' must be in selected columns if keep_denominator_column is True."
+        )
+
+    denominator_column = denominator_column if denominator_column is not None else df.columns[-1]
+
+    if columns:
+        invalid_columns = [col for col in columns if col not in df.columns]
+        if invalid_columns:
+            raise InvalidColumnException(f"The following columns were not found in the dataframe: {invalid_columns}.")
+        columns_to_transform = columns
+
+        if denominator_column not in columns_to_transform:
+            df = df[columns_to_transform + [denominator_column]]
+        else:
+            df = df[columns_to_transform]
+
+    else:
+        columns_to_transform = df.columns.to_list()
+
+    if scale is not None:
+        df = _closure(df, scale)
+
+    check_in_simplex_sample_space(df)
+
+    if not keep_denominator_column and denominator_column in columns_to_transform:
+        columns_to_transform.remove(denominator_column)
+
+    return rename_columns_by_pattern(_alr_transform(df, columns_to_transform, denominator_column))
+
+
+@beartype
+def _inverse_alr(df: pd.DataFrame, denominator_column: str, scale: Number = 1.0) -> pd.DataFrame:
+    dfc = df.copy()
+    if denominator_column not in dfc.columns.values:
+        # Add the denominator column
+        dfc[denominator_column] = 0.0
+
+    return _closure(np.exp(dfc), scale)
+
+
+@beartype
+def inverse_alr(
+    df: pd.DataFrame, denominator_column: str, columns: Optional[Sequence[str]] = None, scale: Number = 1.0
+) -> pd.DataFrame:
+    """
+    Perform the inverse transformation for a set of ALR transformed data.
+
+    Args:
+        df: A dataframe of ALR transformed compositional data.
+        denominator_column: The name of the denominator column.
+        columns: The names of the columns to be transformed.
+        scale: The value to which each composition should be normalized. Eg., if the composition is expressed
+            as percentages, scale=100.
+
+    Returns:
+        A dataframe containing the inverse transformed data.
+
+    Raises:
+        InvalidColumnException: The input column(s) not found in the dataframe.
+        NumericValueSignException: The input scale value is zero or less.
+    """
+    if scale <= 0:
+        raise NumericValueSignException("The scale value should be positive.")
+
+    if columns:
+        invalid_columns = [col for col in columns if col not in df.columns]
+        if invalid_columns:
+            raise InvalidColumnException(f"The following columns were not found in the dataframe: {invalid_columns}.")
+        df = df[columns]
+
+    return _inverse_alr(df, denominator_column, scale)