+
+
+class BlendMode:
+    """
+    Options for modes to use by alphablend() function.
+    """
+
+    Normal = "bitmaptools.BlendMode.Normal"
+    Screen = "bitmaptools.BlendMode.Screen"
+
+
+def alphablend(
+    dest: Bitmap,
+    source1: Bitmap,
+    source2: Bitmap,
+    colorspace: Colorspace,
+    factor1: float = 0.5,
+    factor2: Optional[float] = None,
+    blendmode: BlendMode = BlendMode.Normal,
+    skip_source1_index: Optional[int] = None,
+    skip_source2_index: Optional[int] = None,
+):
+    """Alpha blend the two source bitmaps into the destination.
+
+    It is permitted for the destination bitmap to be one of the two
+    source bitmaps.
+
+    :param bitmap dest_bitmap: Destination bitmap that will be written into
+    :param bitmap source_bitmap_1: The first source bitmap
+    :param bitmap source_bitmap_2: The second source bitmap
+    :param float factor1: The proportion of bitmap 1 to mix in
+    :param float factor2: The proportion of bitmap 2 to mix in.
+      If specified as `None`, ``1-factor1`` is used.  Usually the proportions should sum to 1.
+    :param displayio.Colorspace colorspace: The colorspace of the bitmaps.
+      They must all have the same colorspace.  Only the following colorspaces are permitted:
+      ``L8``, ``RGB565``, ``RGB565_SWAPPED``, ``BGR565`` and ``BGR565_SWAPPED``.
+    :param bitmaptools.BlendMode blendmode: The blend mode to use. Default is Normal.
+    :param int skip_source1_index: Bitmap palette or luminance index in
+      source_bitmap_1 that will not be blended, set to None to blend all pixels
+    :param int skip_source2_index: Bitmap palette or luminance index in
+      source_bitmap_2 that will not be blended, set to None to blend all pixels
+
+    For the L8 colorspace, the bitmaps must have a bits-per-value of 8.
+    For the RGB colorspaces, they must have a bits-per-value of 16."""
+
+    def clamp(val, minval, maxval):
+        return max(minval, min(maxval, val))
+
+    ifactor1 = int(factor1 * 256)
+    ifactor2 = int(factor2 * 256)
+
+    width, height = dest.width, dest.height
+
+    if colorspace == "L8":
+        for y in range(height):
+            for x in range(width):
+                sp1 = source1[x, y]
+                sp2 = source2[x, y]
+                blend_source1 = skip_source1_index is None or sp1 != skip_source1_index
+                blend_source2 = skip_source2_index is None or sp2 != skip_source2_index
+
+                if blend_source1 and blend_source2:
+                    sda = sp1 * ifactor1
+                    sca = sp2 * ifactor2
+
+                    if blendmode == BlendMode.Screen:
+                        blend = sca + sda - (sca * sda // 65536)
+                    elif blendmode == BlendMode.Normal:
+                        blend = sca + sda * (256 - ifactor2) // 256
+
+                    denom = ifactor1 + ifactor2 - ifactor1 * ifactor2 // 256
+                    pixel = blend // denom
+                elif blend_source1:
+                    pixel = sp1 * ifactor1 // 256
+                elif blend_source2:
+                    pixel = sp2 * ifactor2 // 256
+                else:
+                    pixel = dest[x, y]
+
+                dest[x, y] = clamp(pixel, 0, 255)
+
+    else:
+        swap = colorspace in ("RGB565_SWAPPED", "BGR565_SWAPPED")
+        r_mask = 0xF800
+        g_mask = 0x07E0
+        b_mask = 0x001F
+
+        for y in range(height):
+            for x in range(width):
+                sp1 = source1[x, y]
+                sp2 = source2[x, y]
+
+                if swap:
+                    sp1 = ((sp1 & 0xFF) << 8) | ((sp1 >> 8) & 0xFF)
+                    sp2 = ((sp2 & 0xFF) << 8) | ((sp2 >> 8) & 0xFF)
+
+                blend_source1 = skip_source1_index is None or sp1 != skip_source1_index
+                blend_source2 = skip_source2_index is None or sp2 != skip_source2_index
+
+                if blend_source1 and blend_source2:
+                    ifactor_blend = ifactor1 + ifactor2 - ifactor1 * ifactor2 // 256
+
+                    red_dca = ((sp1 & r_mask) >> 8) * ifactor1
+                    grn_dca = ((sp1 & g_mask) >> 3) * ifactor1
+                    blu_dca = ((sp1 & b_mask) << 3) * ifactor1
+
+                    red_sca = ((sp2 & r_mask) >> 8) * ifactor2
+                    grn_sca = ((sp2 & g_mask) >> 3) * ifactor2
+                    blu_sca = ((sp2 & b_mask) << 3) * ifactor2
+
+                    if blendmode == BlendMode.Screen:
+                        red_blend = red_sca + red_dca - (red_sca * red_dca // 65536)
+                        grn_blend = grn_sca + grn_dca - (grn_sca * grn_dca // 65536)
+                        blu_blend = blu_sca + blu_dca - (blu_sca * blu_dca // 65536)
+                    elif blendmode == BlendMode.Normal:
+                        red_blend = red_sca + red_dca * (256 - ifactor2) // 256
+                        grn_blend = grn_sca + grn_dca * (256 - ifactor2) // 256
+                        blu_blend = blu_sca + blu_dca * (256 - ifactor2) // 256
+
+                    r = ((red_blend // ifactor_blend) << 8) & r_mask
+                    g = ((grn_blend // ifactor_blend) << 3) & g_mask
+                    b = ((blu_blend // ifactor_blend) >> 3) & b_mask
+
+                    pixel = (r & r_mask) | (g & g_mask) | (b & b_mask)
+
+                    if swap:
+                        pixel = ((pixel & 0xFF) << 8) | ((pixel >> 8) & 0xFF)
+
+                elif blend_source1:
+                    r = ((sp1 & r_mask) * ifactor1 // 256) & r_mask
+                    g = ((sp1 & g_mask) * ifactor1 // 256) & g_mask
+                    b = ((sp1 & b_mask) * ifactor1 // 256) & b_mask
+                    pixel = r | g | b
+                elif blend_source2:
+                    r = ((sp2 & r_mask) * ifactor2 // 256) & r_mask
+                    g = ((sp2 & g_mask) * ifactor2 // 256) & g_mask
+                    b = ((sp2 & b_mask) * ifactor2 // 256) & b_mask
+                    pixel = r | g | b
+                else:
+                    pixel = dest[x, y]
+
+                print(f"pixel hex: {hex(pixel)}")
+                dest[x, y] = pixel
+
+
+class DitherAlgorithm:
+    """
+    Options for algorithm to use by dither() function.
+    """
+
+    Atkinson = "bitmaptools.DitherAlgorithm.Atkinson"
+    FloydStenberg = "bitmaptools.DitherAlgorithm.FloydStenberg"
+
+    atkinson = {
+        "count": 4,
+        "mx": 2,
+        "dl": 256 // 8,
+        "terms": [
+            {"dx": 2, "dy": 0, "dl": 256 // 8},
+            {"dx": -1, "dy": 1, "dl": 256 // 8},
+            {"dx": 0, "dy": 1, "dl": 256 // 8},
+            {"dx": 0, "dy": 2, "dl": 256 // 8},
+        ],
+    }
+
+    floyd_stenberg = {
+        "count": 3,
+        "mx": 1,
+        "dl": 7 * 256 // 16,
+        "terms": [
+            {"dx": -1, "dy": 1, "dl": 3 * 256 // 16},
+            {"dx": 0, "dy": 1, "dl": 5 * 256 // 16},
+            {"dx": 1, "dy": 1, "dl": 1 * 256 // 16},
+        ],
+    }
+
+    algorithm_map = {Atkinson: atkinson, FloydStenberg: floyd_stenberg}
+
+
+def dither(dest_bitmap, source_bitmap, colorspace, algorithm=DitherAlgorithm.Atkinson):
+    """Convert the input image into a 2-level output image using the given dither algorithm.
+
+    :param bitmap dest_bitmap: Destination bitmap.  It must have
+      a value_count of 2 or 65536.  The stored values are 0 and the maximum pixel value.
+    :param bitmap source_bitmap: Source bitmap that contains the
+      graphical region to be dithered.  It must have a value_count of 65536.
+    :param colorspace: The colorspace of the image.  The supported colorspaces
+      are ``RGB565``, ``BGR565``, ``RGB565_SWAPPED``, and ``BGR565_SWAPPED``
+    :param algorithm: The dither algorithm to use, one of the `DitherAlgorithm` values.
+    """
+    SWAP_BYTES = 1 << 0
+    SWAP_RB = 1 << 1
+    height, width = dest_bitmap.width, dest_bitmap.height
+    swap_bytes = colorspace in (Colorspace.RGB565_SWAPPED, Colorspace.BGR565_SWAPPED)
+    swap_rb = colorspace in (Colorspace.BGR565, Colorspace.BGR565_SWAPPED)
+    algorithm_info = DitherAlgorithm.algorithm_map[algorithm]
+    mx = algorithm_info["mx"]
+    count = algorithm_info["count"]
+    terms = algorithm_info["terms"]
+    dl = algorithm_info["dl"]
+
+    swap = 0
+    if swap_bytes:
+        swap |= SWAP_BYTES
+
+    if swap_rb:
+        swap |= SWAP_RB
+
+    print(f"swap: {swap}")
+
+    # Create row data arrays (3 rows with padding on both sides)
+    rowdata = [[0] * (width + 2 * mx) for _ in range(3)]
+    rows = [rowdata[0][mx:], rowdata[1][mx:], rowdata[2][mx:]]
+
+    # Output array for one row at a time (padded to multiple of 32)
+    out = [False] * (((width + 31) // 32) * 32)
+
+    # Helper function to fill a row with luminance data
+    def fill_row(bitmap, swap, luminance_data, y, mx):
+        if y >= bitmap.height:
+            return
+
+        # Zero out padding area
+        for i in range(mx):
+            luminance_data[-mx + i] = 0
+            luminance_data[bitmap.width + i] = 0
+
+        if bitmap._bits_per_value == 8:
+            for x in range(bitmap.width):
+                luminance_data[x] = bitmap[x, y]
+        else:
+            for x in range(bitmap.width):
+                pixel = bitmap[x, y]
+                if swap & SWAP_BYTES:
+                    # Swap bytes (equivalent to __builtin_bswap16)
+                    pixel = ((pixel & 0xFF) << 8) | ((pixel >> 8) & 0xFF)
+
+                r = (pixel >> 8) & 0xF8
+                g = (pixel >> 3) & 0xFC
+                b = (pixel << 3) & 0xF8
+
+                if swap & SWAP_BYTES:
+                    r, b = b, r
+
+                # Calculate luminance using same formula as C version
+                luminance_data[x] = (r * 78 + g * 154 + b * 29) // 256
+
+    # Helper function to write pixels to destination bitmap
+    def write_pixels(bitmap, y, data):
+        if bitmap._bits_per_value == 1:
+            for i in range(0, bitmap.width, 32):
+                # Pack 32 bits into an integer
+                p = 0
+                for j in range(min(32, bitmap.width - i)):
+                    p = p << 1
+                    if data[i + j]:
+                        p |= 1
+
+                # Write packed value
+                for j in range(min(32, bitmap.width - i)):
+                    bitmap[i + j, y] = (p >> (31 - j)) & 1
+        else:
+            for i in range(bitmap.width):
+                bitmap[i, y] = 65535 if data[i] else 0
+
+    # Fill initial rows
+    fill_row(source_bitmap, swap, rows[0], 0, mx)
+    fill_row(source_bitmap, swap, rows[1], 1, mx)
+    fill_row(source_bitmap, swap, rows[2], 2, mx)
+
+    err = 0
+
+    for y in range(height):
+        # Going left to right
+        for x in range(width):
+            pixel_in = rows[0][x] + err
+            pixel_out = pixel_in >= 128
+            out[x] = pixel_out
+
+            err = pixel_in - (255 if pixel_out else 0)
+
+            # Distribute error to neighboring pixels
+            for i in range(count):
+                x1 = x + terms[i]["dx"]
+                dy = terms[i]["dy"]
+
+                rows[dy][x1] = ((terms[i]["dl"] * err) // 256) + rows[dy][x1]
+
+            err = (err * dl) // 256
+
+        write_pixels(dest_bitmap, y, out)
+
+        # Cycle the rows
+        rows[0], rows[1], rows[2] = rows[1], rows[2], rows[0]
+
+        y += 1
+        if y == height:
+            break
+
+        # Fill the next row for future processing
+        fill_row(source_bitmap, swap, rows[2], y + 2, mx)
+
+        # Going right to left
+        for x in range(width - 1, -1, -1):
+            pixel_in = rows[0][x] + err
+            pixel_out = pixel_in >= 128
+            out[x] = pixel_out
+
+            err = pixel_in - (255 if pixel_out else 0)
+
+            # Distribute error to neighboring pixels (in reverse direction)
+            for i in range(count):
+                x1 = x - terms[i]["dx"]
+                dy = terms[i]["dy"]
+
+                rows[dy][x1] = ((terms[i]["dl"] * err) // 256) + rows[dy][x1]
+
+            err = (err * dl) // 256
+
+        write_pixels(dest_bitmap, y, out)
+
+        # Cycle the rows again
+        rows[0], rows[1], rows[2] = rows[1], rows[2], rows[0]
+
+        # Fill the next row for future processing
+        fill_row(source_bitmap, swap, rows[2], y + 3, mx)
+
+
+def boundary_fill(
+    dest_bitmap: Bitmap,
+    x: int,
+    y: int,
+    fill_color_value: int,
+    replaced_color_value: Optional[int] = None,
+):
+    """Draws the color value into the destination bitmap enclosed
+    area of pixels of the background_value color. Like "Paint Bucket"
+    fill tool.
+
+    :param bitmap dest_bitmap: Destination bitmap that will be written into
+    :param int x: x-pixel position of the first pixel to check and fill if needed
+    :param int y: y-pixel position of the first pixel to check and fill if needed
+    :param int fill_color_value: Bitmap palette index that will be written into the
+           enclosed area in the destination bitmap
+    :param int replaced_color_value: Bitmap palette index that will filled with the
+           value color in the enclosed area in the destination bitmap"""
+    if fill_color_value == replaced_color_value:
+        return
+    if replaced_color_value == -1:
+        replaced_color_value = dest_bitmap[x, y]
+
+    fill_points = []
+    fill_points.append((x, y))
+
+    seen_points = []
+    minx = x
+    miny = y
+    maxx = x
+    maxy = y
+
+    while len(fill_points) > 0:
+        cur_point = fill_points.pop(0)
+        seen_points.append(cur_point)
+        cur_x = cur_point[0]
+        cur_y = cur_point[1]
+
+        cur_point_color = dest_bitmap[cur_x, cur_y]
+        if replaced_color_value is not None and cur_point_color != replaced_color_value:
+            continue
+        if cur_x < minx:
+            minx = cur_x
+        if cur_y < miny:
+            miny = cur_y
+        if cur_x > maxx:
+            maxx = cur_x
+        if cur_y > maxy:
+            maxy = cur_y
+
+        dest_bitmap[cur_x, cur_y] = fill_color_value
+
+        above_point = (cur_x, cur_y - 1)
+        below_point = (cur_x, cur_y + 1)
+        left_point = (cur_x - 1, cur_y)
+        right_point = (cur_x + 1, cur_y)
+
+        if (
+            above_point[1] >= 0
+            and above_point not in seen_points
+            and above_point not in fill_points
+        ):
+            fill_points.append(above_point)
+        if (
+            below_point[1] < dest_bitmap.height
+            and below_point not in seen_points
+            and below_point not in fill_points
+        ):
+            fill_points.append(below_point)
+        if (
+            left_point[0] >= 0
+            and left_point not in seen_points
+            and left_point not in fill_points
+        ):
+            fill_points.append(left_point)
+        if (
+            right_point[0] < dest_bitmap.width
+            and right_point not in seen_points
+            and right_point not in fill_points
+        ):
+            fill_points.append(right_point)