core.c

/* OX: Open-Channel NVM Express SSD Controller
 *
 *  - OX Controller Core
 *
 * Copyright (C) 2016, IT University of Copenhagen. All rights reserved.
 * Written by Ivan Luiz Picoli <ivpi@itu.dk>
 *
 * Funding support provided by CAPES Foundation, Ministry of Education
 * of Brazil, Brasilia - DF 70040-020, Brazil.
 *
 * Redistribution and use in source and binary forms, with or without
 * modification, are permitted provided that the following conditions are met:
 *
 *  - Redistributions of source code must retain the above copyright notice,
 *  this list of conditions and the following disclaimer.
 *  - Redistributions in binary form must reproduce the above copyright notice,
 *  this list of conditions and the following disclaimer in the documentation
 *  and/or other materials provided with the distribution.
 *
 * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND ANY
 * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
 * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
 * DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR ANY
 * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
 * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
 * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
 * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
 * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
 * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 *
 * The controller core is responsible to handle:
 *
 *      - Media managers: NAND, DDR, etc.
 *      - Flash Translation Layers + LightNVM raw FTL support
 *      - Interconnect handler: PCIe, network fabric, etc.
 *      - NVMe queues and tail/head doorbells
 *      - NVMe, LightNVM and Fabric(not implemented) command parser
 *      - RDMA handler(not implemented): RoCE, InfiniBand, etc.
 *
 *      Media managers are responsible to manage the flash storage and expose
 *    channels + its geometry (LUNs, blocks, pages, page_size).
 *
 *      Flash Translation Layers are responsible to manage channels, receive
 *    IO commands and send page-granularity IOs to media managers.
 *
 *      Interconnect handlers are responsible to receive NVMe, LightNVM and
 *    Fabric commands from the interconnection (PCIe or Fabrics) and send to
 *    command parser.
 *
 *      NVMe queue support is responsible to read / write to NVMe registers,
 *    process queue doorbells and manage the admin + IO queue(s).
 *
 *      Command parsers are responsible to parse Admin (and execute it) and
 *    IO (send to the FTL) commands coming from the interconnection. It is
 *    possible to set the device as NVMe or LightNVM (OpenChannel device).
 */

#include "include/ssd.h"

#include <stdio.h>
#include <time.h>
#include <stdlib.h>
#include <stdint.h>
#include <string.h>
#include <sys/queue.h>
#include <syslog.h>
#include <mqueue.h>
#include <pthread.h>
#include <signal.h>
#include <setjmp.h>
#include <argp.h>
#include <sys/time.h>
#include "include/uatomic.h"
#include "include/ox-mq.h"

LIST_HEAD(mmgr_list, nvm_mmgr) mmgr_head = LIST_HEAD_INITIALIZER(mmgr_head);
LIST_HEAD(ftl_list, nvm_ftl) ftl_head = LIST_HEAD_INITIALIZER(ftl_head);

struct core_struct core;
struct tests_init_st tests_is __attribute__((weak));

int nvm_register_pcie_handler (struct nvm_pcie *pcie)
{
    if (strlen(pcie->name) > MAX_NAME_SIZE)
        return EMAX_NAME_SIZE;

    if(pthread_create (&pcie->io_thread, NULL, pcie->ops->nvme_consumer, pcie))
        return EPCIE_REGISTER;

    core.nvm_pcie = pcie;

    log_info("  [nvm: PCI Handler registered: %s]\n", pcie->name);

    return 0;
}

int nvm_register_mmgr (struct nvm_mmgr *mmgr)
{
    if (strlen(mmgr->name) > MAX_NAME_SIZE)
        return EMAX_NAME_SIZE;

    mmgr->ch_info = calloc(sizeof(struct nvm_channel),mmgr->geometry->n_of_ch);
    if (!mmgr->ch_info)
        return EMMGR_REGISTER;

    if (mmgr->ops->get_ch_info(mmgr->ch_info, mmgr->geometry->n_of_ch))
        return EMMGR_REGISTER;

    LIST_INSERT_HEAD(&mmgr_head, mmgr, entry);
    core.mmgr_count++;
    core.nvm_ch_count += mmgr->geometry->n_of_ch;

    log_info("  [nvm: Media Manager registered: %s]\n", mmgr->name);

    return 0;
}

static struct nvm_ftl *nvm_get_ftl_instance(uint16_t ftl_id)
{
    struct nvm_ftl *ftl;
    LIST_FOREACH(ftl, &ftl_head, entry){
        if(ftl->ftl_id == ftl_id)
            return ftl;
    }

    return NULL;
}

static uint16_t nvm_ftl_q_schedule (struct nvm_ftl *ftl, struct nvm_io_cmd *cmd)
{
    return cmd->channel->ch_id % ftl->nq;
}

static void nvm_complete_to_host (struct nvm_io_cmd *cmd)
{
    NvmeRequest *req = (NvmeRequest *) cmd->req;

    req->status = (cmd->status.status == NVM_IO_SUCCESS) ?
                NVME_SUCCESS : (cmd->status.nvme_status) ?
                      cmd->status.nvme_status : NVME_CMD_ABORT_REQ;

    if (core.debug)
        printf(" [NVMe cmd 0x%x. cid: %d completed. Status: %x]\n",
                                   req->cmd.opcode, req->cmd.cid, req->status);

    ((core.run_flag & RUN_TESTS) && core.tests_init->complete_io) ?
        core.tests_init->complete_io(req) : nvme_rw_cb(req);
}

void nvm_complete_ftl (struct nvm_io_cmd *cmd)
{
    int retry, ret;
    struct ox_mq_entry *req = (struct ox_mq_entry *) cmd->mq_req;

    retry = NVM_QUEUE_RETRY;
    do {
        ret = ox_mq_complete_req(cmd->channel->ftl->mq, req);
        if (ret) {
            retry--;
            usleep (NVM_QUEUE_RETRY_SLEEP);
        }
    } while (ret && retry);
}

static void nvm_ftl_process_sq (struct ox_mq_entry *req)
{
    struct nvm_io_cmd *cmd = (struct nvm_io_cmd *) req->opaque;
    struct nvm_ftl *ftl = cmd->channel->ftl;
    int ret;

    cmd->mq_req = (void *) req;
    ret = ftl->ops->submit_io(cmd);

    if (ret) {
        log_err ("[ERROR: Cmd %x not completed. Aborted.]\n", cmd->cmdtype);
        nvm_complete_ftl(cmd);
    }
}

static void nvm_ftl_process_cq (void *opaque)
{
    struct nvm_io_cmd *cmd = (struct nvm_io_cmd *) opaque;

    nvm_complete_to_host (cmd);
}

static void nvm_ftl_process_to (void **opaque, int counter)
{
    struct nvm_io_cmd *cmd;

    while (counter) {
        counter--;
        cmd = (struct nvm_io_cmd *) opaque[counter];
        cmd->status.status = NVM_IO_FAIL;
        cmd->status.nvme_status = NVME_CMD_ABORT_REQ;
    }
}

int nvm_register_ftl (struct nvm_ftl *ftl)
{
    struct ox_mq_config mq_config;

    if (strlen(ftl->name) > MAX_NAME_SIZE)
        return EMAX_NAME_SIZE;

    /* Start FTL multi-queue */
    mq_config.n_queues = ftl->nq;
    mq_config.q_size = NVM_FTL_QUEUE_SIZE;
    mq_config.sq_fn = nvm_ftl_process_sq;
    mq_config.cq_fn = nvm_ftl_process_cq;
    mq_config.to_fn = nvm_ftl_process_to;
    mq_config.to_usec = 0;
    mq_config.flags = OX_MQ_TO_COMPLETE;
    ftl->mq = ox_mq_init(&mq_config);
    if (!ftl->mq)
        return EFTL_REGISTER;

    core.ftl_q_count += ftl->nq;

    LIST_INSERT_HEAD(&ftl_head, ftl, entry);
    core.ftl_count++;

    log_info("  [nvm: FTL (%s)(%d) registered.]\n", ftl->name, ftl->ftl_id);
    if (ftl->cap & 1 << FTL_CAP_GET_BBTBL)
        log_info("    [%s cap: Get Bad Block Table]\n", ftl->name);
    if (ftl->cap & 1 << FTL_CAP_SET_BBTBL)
        log_info("    [%s cap: Set Bad Block Table]\n", ftl->name);
    if (ftl->cap & 1 << FTL_CAP_GET_L2PTBL)
        log_info("    [%s cap: Get Logical to Physical Table]\n", ftl->name);
    if (ftl->cap & 1 << FTL_CAP_GET_L2PTBL)
        log_info("    [%s cap: Set Logical to Physical Table]\n", ftl->name);

    if (ftl->bbtbl_format == FTL_BBTBL_BYTE)
        log_info("    [%s Bad block table type: Byte array. 1 byte per blk.]\n",
                                                                    ftl->name);
    return 0;
}

static void nvm_debug_print_mmgr_io (struct nvm_mmgr_io_cmd *cmd)
{
    printf (" [IO CALLBK. CMD 0x%x. mmgr_ch: %d, lun: %d, blk: %d, pl: %d, "
                     "pg: %d]\n", cmd->cmdtype, cmd->ppa.g.ch, cmd->ppa.g.lun,
                      cmd->ppa.g.blk, cmd->ppa.g.pl, cmd->ppa.g.pg);
}

void nvm_callback (struct nvm_mmgr_io_cmd *cmd)
{
    if (nvm_memcheck(cmd))
        return;

    gettimeofday(&cmd->tend,NULL);

    if (core.debug)
        nvm_debug_print_mmgr_io (cmd);

    if (cmd->status != NVM_IO_SUCCESS)
        log_err (" [FAILED 0x%x CMD. mmgr_ch: %d, lun: %d, blk: %d, pl: %d, "
                "pg: %d]\n", cmd->cmdtype, cmd->ppa.g.ch, cmd->ppa.g.lun,
                cmd->ppa.g.blk, cmd->ppa.g.pl, cmd->ppa.g.pg);

    if (cmd->sync_count) {
        pthread_mutex_lock(cmd->sync_mutex);
        if (cmd->status != NVM_IO_TIMEOUT) {
            atomic_dec(cmd->sync_count);
        }
        pthread_mutex_unlock(cmd->sync_mutex);
    } else {
        cmd->nvm_io->channel->ftl->ops->callback_io(cmd);
    }
}

int nvm_submit_ftl (struct nvm_io_cmd *cmd)
{
    struct nvm_channel *ch;
    int ret, retry, i, qid;
    NvmeRequest *req = (NvmeRequest *) cmd->req;
    uint8_t aux_ch;

    cmd->status.nvme_status = NVME_SUCCESS;

    switch (cmd->status.status) {
        case NVM_IO_NEW:
            break;
        case NVM_IO_PROCESS:
            break;
        case NVM_IO_FAIL:
            req->status = NVME_CMD_ABORT_REQ;
            nvm_complete_to_host(cmd);
            return NVME_CMD_ABORT_REQ;
        case NVM_IO_SUCCESS:
            req->status = NVME_SUCCESS;
            nvm_complete_to_host(cmd);
            return NVME_SUCCESS;
        default:
            req->status = NVME_CMD_ABORT_REQ;
            nvm_complete_to_host(cmd);
            return NVME_CMD_ABORT_REQ;
    }

#if LIGHTNVM
    /* For now, the host ppa channel must be aligned with core.nvm_ch[] */
    /* All ppas within the vector must address to the same channel */
    aux_ch = cmd->ppalist[0].g.ch;

    if (aux_ch >= core.nvm_ch_count) {
        syslog(LOG_INFO,"[nvm ERROR: IO failed, channel not found.]\n");
        req->status = NVME_CMD_ABORT_REQ;
        nvm_complete_to_host(cmd);
        return NVME_CMD_ABORT_REQ;
    }

    for (i = 1; i < cmd->n_sec; i++) {
        if (cmd->ppalist[i].g.ch != aux_ch) {
            syslog(LOG_INFO,"[nvm ERROR: IO failed, ch does not match.]\n");
            req->status = NVME_INVALID_FIELD;
            nvm_complete_to_host(cmd);
            return NVME_INVALID_FIELD;
        }
    }

    ch = core.nvm_ch[aux_ch];
#else
    /* For now all channels must be included in the global namespace */
    for (i = 0; i < core.nvm_ch_count; i++) {
        if (cmd->slba >= core.nvm_ch[i]->slba && cmd->slba <=
                                                        core.nvm_ch[i]->elba) {
            ch = core.nvm_ch[i];
            break;
        }
        syslog(LOG_INFO,"[nvm ERROR: IO failed, channel not found.]\n");
        req->status = NVME_CMD_ABORT_REQ;
        nvm_complete_to_host(cmd);
        return NVME_CMD_ABORT_REQ;
    }
#endif /* LIGHTNVM */

    cmd->status.status = NVM_IO_PROCESS;
    cmd->channel = ch;
    retry = NVM_QUEUE_RETRY;

    qid = nvm_ftl_q_schedule (ch->ftl, cmd);
    do {
        ret = ox_mq_submit_req(ch->ftl->mq, qid, cmd);

    	if (ret)
            retry--;
        else if (core.debug)
            printf(" CMD cid: %lu, type: 0x%x submitted to FTL. \n  Channel: "
                  "%d, FTL queue %d\n", cmd->cid, cmd->cmdtype, ch->ch_id, qid);

    } while (ret && retry);

    if (core.debug)
        usleep (150000);

    return (retry) ? NVME_NO_COMPLETE : NVME_CMD_ABORT_REQ;
}

int nvm_dma (void *ptr, uint64_t prp, ssize_t size, uint8_t direction)
{
    if (!size || !prp)
        return 0;

    switch (direction) {
        case NVM_DMA_TO_HOST:
            return nvme_write_to_host(ptr, prp, size);
        case NVM_DMA_FROM_HOST:
            return nvme_read_from_host(ptr, prp, size);
        case NVM_DMA_SYNC_READ:
            memcpy ((void *) prp, ptr, size);
            break;
        case NVM_DMA_SYNC_WRITE:
            memcpy (ptr, (void *) prp, size);
            break;
        default:
            return -1;
    }
    return 0;
}

int nvm_submit_mmgr (struct nvm_mmgr_io_cmd *cmd)
{
    gettimeofday(&cmd->tstart,NULL);
    cmd->cmdtype = cmd->nvm_io->cmdtype;

    switch (cmd->nvm_io->cmdtype) {
        case MMGR_WRITE_PG:
            return cmd->nvm_io->channel->mmgr->ops->write_pg(cmd);
        case MMGR_READ_PG:
            return cmd->nvm_io->channel->mmgr->ops->read_pg(cmd);
        case MMGR_ERASE_BLK:
            return cmd->nvm_io->channel->mmgr->ops->erase_blk(cmd);
        default:
            return -1;
    }
}

static void nvm_sync_io_free (uint8_t flags, void *buf,
                                                   struct nvm_mmgr_io_cmd *cmd)
{
    if (flags & NVM_SYNCIO_FLAG_DEC) {
        pthread_mutex_lock(cmd->sync_mutex);
        atomic_dec(cmd->sync_count);
        pthread_mutex_unlock(cmd->sync_mutex);
    }

    if (flags & NVM_SYNCIO_FLAG_BUF)
        free (buf);

    if (flags & NVM_SYNCIO_FLAG_SYNC) {
        pthread_mutex_destroy (cmd->sync_mutex);
        free (cmd->sync_count);
        free (cmd->sync_mutex);
    }
}

static int nvm_sync_io_prepare (struct nvm_channel *ch,
                        struct nvm_mmgr_io_cmd *cmd, void *buf, uint8_t flags)
{
    int i;

    if (!ch)
        return -1;

    if (!cmd->sync_count || !cmd->sync_mutex) {
        cmd->sync_count = malloc (sizeof (atomic_t));
        if (!cmd->sync_count)
            return -1;
        cmd->sync_mutex = malloc (sizeof (pthread_mutex_t));
        if (!cmd->sync_mutex) {
            free (cmd->sync_count);
            return -1;
        }
        cmd->sync_count->counter = ATOMIC_INIT_RUNTIME(0);
        pthread_mutex_init (cmd->sync_mutex, NULL);
        flags |= NVM_SYNCIO_FLAG_SYNC;
    }

    cmd->ppa.g.ch = ch->ch_mmgr_id;

    if (cmd->cmdtype == MMGR_ERASE_BLK)
        goto OUT;

    if (cmd->pg_sz == 0)
        cmd->pg_sz = NVM_PG_SIZE;
    if (cmd->sec_sz == 0)
        cmd->sec_sz = ch->geometry->pg_size / ch->geometry->sec_per_pg;
    if (cmd->md_sz == 0)
        cmd->md_sz = ch->geometry->sec_oob_sz * ch->geometry->sec_per_pg;
    if (cmd->n_sectors == 0)
        cmd->n_sectors = ch->geometry->sec_per_pg;

    if (!buf) {
        buf = malloc(ch->geometry->pg_size + ch->geometry->sec_oob_sz);
        if (!buf) {
            nvm_sync_io_free (flags, NULL, cmd);
            return -1;
        }
        flags |= NVM_SYNCIO_FLAG_BUF;
    }

    for (i = 0; i < cmd->n_sectors; i++) {
        cmd->prp[i] = (uint64_t) buf + cmd->sec_sz * i;
    }
    cmd->md_prp = (uint64_t) buf + cmd->sec_sz * cmd->n_sectors;

OUT:
    return 0;
}

/**
 * Submit an IO to a specific channel and wait for completion to return.
 * Please, use nvm_submit_multi_plane_sync_io if you have planes > 1
 *
 * BE CAREFUL WHEN MULTIPLE THREADS USE THE SAME ATOMIC INT: If cmd->sync_count
 * and cmd->sync_mutex are not NULL, multiple threads can share the same
 * waiting loop. If so, all threads will return when all IOs are completed.
 *
 * @param ch - nvm_channel pointer
 * @param cmd - Media manager command pointer
 * @param buf - Pointer to dma data
 * @param cmdtype - MMGR_READ_PG, MMGR_WRITE_PG, MMGR_ERASE_BLK
 * @return 0 on success
 */
int nvm_submit_sync_io (struct nvm_channel *ch, struct nvm_mmgr_io_cmd *cmd,
                                                    void *buf, uint8_t cmdtype)
{
    int ret = 0, i;
    uint8_t flags = 0;
    time_t start;
    struct nvm_mmgr *mmgr;
    char err[64];

    cmd->cmdtype = cmdtype;
    if (nvm_sync_io_prepare (ch, cmd, buf, flags))
        goto ERR;

    mmgr = ch->mmgr;
    if (!mmgr)
        goto ERR;

    pthread_mutex_lock(cmd->sync_mutex);
    atomic_inc(cmd->sync_count);
    pthread_mutex_unlock(cmd->sync_mutex);
    flags |= NVM_SYNCIO_FLAG_DEC;

    cmd->status = NVM_IO_PROCESS;

    gettimeofday(&cmd->tstart,NULL);

    switch (cmdtype) {
        case MMGR_READ_PG:
            ret = mmgr->ops->read_pg(cmd);
            break;
        case MMGR_WRITE_PG:
            ret = mmgr->ops->write_pg(cmd);
            break;
        case MMGR_ERASE_BLK:
            ret = mmgr->ops->erase_blk(cmd);
            break;
        default:
            ret = ESYNC_IO;
    }

    if (core.debug)
        printf("[Sync IO: 0x%x ppa: ch %d, lun %d, blk %d, pl %d, pg %d]\n",
                cmd->cmdtype, cmd->ppa.g.ch, cmd->ppa.g.lun, cmd->ppa.g.blk,
                cmd->ppa.g.pl, cmd->ppa.g.pg);

    if (ret) {
        nvm_sync_io_free (flags, buf, cmd);
        goto ERR;
    }

    /* Concurrent threads with the same sync_counter wait others to complete */
    start = time(NULL);
    i = 1;
    do {
        if (time(NULL) > start + NVM_SYNCIO_TO) {
            cmd->status = NVM_IO_TIMEOUT;
            nvm_sync_io_free (flags, buf, cmd);
            log_err ("[nvm: Sync IO cmd 0x%x TIMEOUT. Aborted.]\n",cmd->cmdtype);
            return ESYNC_IO;
        }
        pthread_mutex_lock(cmd->sync_mutex);
        i = atomic_read(cmd->sync_count);
        pthread_mutex_unlock(cmd->sync_mutex);
        if (i)
            usleep(1);
    } while (i || cmd->status == NVM_IO_PROCESS);

    ret = (cmd->status == NVM_IO_SUCCESS) ? 0 : ESYNC_IO;

    flags ^= NVM_SYNCIO_FLAG_DEC;
    nvm_sync_io_free (flags, buf, cmd);

    if (!ret) return ret;
ERR:
    sprintf(err, "[ERROR: Sync IO cmd 0x%x with errors. Aborted.]\n",
                                                                  cmd->cmdtype);
    log_err ("%s",err);
    if (core.debug) printf ("%s",err);

    return ESYNC_IO;
}

void *nvm_sub_pl_sio_th (void *arg)
{
    struct nvm_sync_io_arg *ptr = (struct nvm_sync_io_arg *) arg;
    ptr->status = nvm_submit_sync_io(ptr->ch, ptr->cmd, ptr->buf, ptr->cmdtype);

    return NULL;
}

/**
 * Use this function to submit a synchronous IO using multi-plane. All pages
 * within the plane-page will be asynchronous. Refer to nvm_submit_sync_io
 * for further info about synchronous IO.
 *
 * ENSURE YOUR *buf HAS ENOUGH SPACE FOR N_PLANES * (PAGE_SIZE + OOB) and *cmd
 * is an array of N_PLANES nvm_mmgr_io_cmd
 *
 * @params Refer to nvm_submit_sync_io
 * @pl_delay Delay between plane-page IOs in u-seconds, 0 to ignore the delay
 */

int nvm_submit_multi_plane_sync_io (struct nvm_channel *ch,
     struct nvm_mmgr_io_cmd *cmd, void *buf, uint8_t cmdtype, uint64_t pl_delay)
{
    int pl_i, ret = 0, pl = ch->geometry->n_of_planes;
    pthread_t               tid[pl];
    struct nvm_sync_io_arg  pl_arg[pl];

    for (pl_i = 0; pl_i < pl; pl_i++) {
        cmd[pl_i].ppa.g.pl = pl_i;
        if (cmdtype != MMGR_ERASE_BLK)
            pl_arg[pl_i].buf = buf + (NVM_PG_SIZE + NVM_OOB_SIZE) * pl_i;

        pl_arg[pl_i].ch = ch;
        pl_arg[pl_i].cmdtype = cmdtype;
        pl_arg[pl_i].cmd = &cmd[pl_i];
        pthread_create(&tid[pl_i],NULL,nvm_sub_pl_sio_th,(void *)&pl_arg[pl_i]);

        if (pl_delay > 0)
            usleep(pl_delay);
    }

    for (pl_i = 0; pl_i < pl; pl_i++) {
        pthread_join(tid[pl_i], NULL);
        if (pl_arg->status) ret++;
    }

    return ret;
}

static void nvm_unregister_mmgr (struct nvm_mmgr *mmgr)
{
    if (LIST_EMPTY(&mmgr_head))
        return;

    mmgr->ops->exit(mmgr);
    free(mmgr->ch_info);
    LIST_REMOVE(mmgr, entry);
    core.mmgr_count--;
    log_info(" [nvm: Media Manager unregistered: %s]\n", mmgr->name);
}

static void nvm_unregister_ftl (struct nvm_ftl *ftl)
{
    if (LIST_EMPTY(&ftl_head))
        return;

    ox_mq_destroy(ftl->mq);
    core.ftl_q_count -= ftl->nq;

    ftl->ops->exit(ftl);
    LIST_REMOVE(ftl, entry);
    core.ftl_count--;
    log_info(" [nvm: FTL (%s)(%d) unregistered.]\n", ftl->name, ftl->ftl_id);
}

static int nvm_ch_config ()
{
    int i, c = 0, ret;

    core.nvm_ch = calloc(sizeof(struct nvm_channel *), core.nvm_ch_count);
    if (nvm_memcheck(core.nvm_ch))
        return EMEM;

    struct nvm_channel *ch;
    struct nvm_mmgr *mmgr;
    LIST_FOREACH(mmgr, &mmgr_head, entry){
        for (i = 0; i < mmgr->geometry->n_of_ch; i++){
            ch = core.nvm_ch[c] = &mmgr->ch_info[i];
            ch->ch_id       = c;
            ch->geometry    = mmgr->geometry;
            ch->mmgr        = mmgr;

            /* For now we set all channels to be managed by the standard FTL */
            /* For now all channels are set to the same namespace */
            if (ch->i.in_use != NVM_CH_IN_USE) {
                ch->i.in_use = NVM_CH_IN_USE;
                ch->i.ns_id = 0x1;
                ch->i.ns_part = c;
                ch->i.ftl_id = FTL_ID_STANDARD;

                /* FLush new config to NVM */
                mmgr->ops->set_ch_info(ch, 1);
            }

            ch->ftl = nvm_get_ftl_instance(ch->i.ftl_id);

            if(!ch->ftl || !ch->mmgr || ch->geometry->pg_size != NVM_PG_SIZE)
                return ECH_CONFIG;

            /* ftl must set available number of pages */
            ret = ch->ftl->ops->init_ch(ch);
                if (ret) return ret;

            ch->tot_bytes = ch->ns_pgs *
                                  (ch->geometry->pg_size & 0xffffffffffffffff);
            ch->slba = core.nvm_ns_size;
            ch->elba = core.nvm_ns_size + ch->tot_bytes - 1;

            core.nvm_ns_size += ch->tot_bytes;
            c++;
        }
    }

    return 0;
}

static int nvm_ftl_cap_get_bbtbl (struct nvm_ppa_addr *ppa,
                                            struct nvm_channel *ch, void **arg)
{
    uint8_t  *bbtbl     = (uint8_t *)  arg[1];
    uint32_t *nblk      = (uint32_t *) arg[2];
    uint16_t *bb_format = (uint16_t *) arg[3];

    if (*nblk < 1)
        return -1;

    if (ch->ftl->bbtbl_format == *bb_format)
        return ch->ftl->ops->get_bbtbl(ppa, bbtbl, *nblk);

    return -1;
}

static int nvm_ftl_cap_set_bbtbl (struct nvm_ppa_addr *ppa,
                                            struct nvm_channel *ch, void **arg)
{
    uint8_t *value      = (uint8_t *)  arg[1];
    uint16_t *bb_format = (uint16_t *) arg[2];

    if (ch->ftl->bbtbl_format == *bb_format)
        return ch->ftl->ops->set_bbtbl(ppa, *value);

    return -1;
}

int nvm_ftl_cap_exec (uint8_t cap, void **arg, int narg)
{
    struct nvm_ppa_addr *ppa;
    struct nvm_channel *ch;
    int i;

    if (narg < 1)
        goto OUT;

    for (i = 0; i < narg; i++) {
        if (nvm_memcheck(arg[i]))
            goto OUT;
    }

    ppa = arg[0];
    ch = core.nvm_ch[ppa->g.ch];
    if (nvm_memcheck(ch))
        goto OUT;

    switch (cap) {
        case FTL_CAP_GET_BBTBL:

            if (narg < 4 || nvm_memcheck(ch->ftl->ops->get_bbtbl))
                goto OUT;
            if (ch->ftl->cap & 1 << FTL_CAP_GET_BBTBL) {
                if (nvm_ftl_cap_get_bbtbl(ppa, ch, arg)) goto OUT;
                return 0;
            }
            break;

        case FTL_CAP_SET_BBTBL:

            if (narg < 3 || nvm_memcheck(ch->ftl->ops->set_bbtbl))
                goto OUT;

            if (ch->ftl->cap & 1 << FTL_CAP_SET_BBTBL) {
                if (nvm_ftl_cap_set_bbtbl(ppa, ch, arg)) goto OUT;
                return 0;
            }

            break;

        case FTL_CAP_GET_L2PTBL:
        case FTL_CAP_SET_L2PTBL:
        default:
            goto OUT;
    }

OUT:
    log_err ("[ERROR: FTL capability: %x. Aborted.]\n", cap);
    return -1;
}

static int nvm_init ()
{
    int ret;
    core.mmgr_count = 0;
    core.ftl_count = 0;
    core.ftl_q_count = 0;
    core.nvm_ch_count = 0;
    core.run_flag = 0;

    core.nvm_nvme_ctrl = malloc (sizeof (NvmeCtrl));
    if (!core.nvm_nvme_ctrl)
        return EMEM;
    core.nvm_nvme_ctrl->running = 1; /* not ready */
    core.run_flag |= RUN_NVME_ALLOC;

    /* media managers */
#ifdef CONFIG_MMGR_DFCNAND
    ret = mmgr_dfcnand_init();
    if(ret) goto OUT;
#endif
#ifdef CONFIG_MMGR_VOLT
    ret = mmgr_volt_init();
    if(ret) goto OUT;
#endif
    core.run_flag |= RUN_MMGR;

    /* flash translation layers */
#ifdef CONFIG_FTL_LNVM
    ret = ftl_lnvm_init();
    if(ret) goto OUT;
#endif
    core.run_flag |= RUN_FTL;

    /* create channels and global namespace */
    ret = nvm_ch_config();
    if(ret) goto OUT;
    core.run_flag |= RUN_CH;

    /* pci handler */
    ret = dfcpcie_init();
    if(ret) goto OUT;
    core.run_flag |= RUN_PCIE;

    /* nvme standard */
    ret = nvme_init(core.nvm_nvme_ctrl);
    if(ret) goto OUT;
    core.run_flag |= RUN_NVME;
    core.run_flag |= RUN_TESTS;
    core.nvm_nvme_ctrl->running = 0; /* ready */

    return 0;

OUT:
    return ret;
}

static void nvm_clean_all ()
{
    struct nvm_ftl *ftl;
    struct nvm_mmgr *mmgr;

    /* Clean PCIe handler */
    if(core.nvm_pcie && (core.run_flag & RUN_PCIE)) {
        core.nvm_pcie->ops->exit();
        core.run_flag ^= RUN_PCIE;
    }

    /* Clean channels */
    if (core.run_flag & RUN_CH) {
        free(core.nvm_ch);
        core.run_flag ^= RUN_CH;
    }

    /* Clean all ftls */
    if (core.run_flag & RUN_FTL) {
        while (core.ftl_count) {
            ftl = LIST_FIRST(&ftl_head);
            nvm_unregister_ftl(ftl);
        };
        core.run_flag ^= RUN_FTL;
    }

    /* Clean all media managers */
    if (core.run_flag & RUN_MMGR) {
        while (core.mmgr_count) {
            mmgr = LIST_FIRST(&mmgr_head);
            nvm_unregister_mmgr(mmgr);
        };
        core.run_flag ^= RUN_MMGR;
    }

    /* Clean Nvme */
    if((core.run_flag & RUN_NVME) && core.nvm_nvme_ctrl->num_namespaces) {
        nvme_exit();
        core.run_flag ^= RUN_NVME;
    }
    if ((core.run_flag & RUN_TESTS) == 0 && (core.run_flag & RUN_NVME_ALLOC)) {
        free(core.nvm_nvme_ctrl);
        core.run_flag ^= RUN_NVME_ALLOC;
    }

    printf("OX Controller closed succesfully.\n");
}

static struct nvm_mmgr *nvm_get_mmgr (char *name)
{
    struct nvm_mmgr *mmgr;
    LIST_FOREACH(mmgr, &mmgr_head, entry){
        if(strcmp(mmgr->name,name) == 0)
            return mmgr;
    }
    return NULL;
}

static void nvm_printerror (int error)
{
    switch (error) {
        case EMAX_NAME_SIZE:
            log_err ("nvm: Name size out of bounds.\n");
            break;
        case EMMGR_REGISTER:
            log_err ("nvm: Error when register mmgr.\n");
            break;
        case EFTL_REGISTER:
            log_err ("nvm: Error when register FTL.\n");
            break;
        case EPCIE_REGISTER:
            log_err ("nvm: Error when register PCIe interconnection.\n");
            break;
        case ENVME_REGISTER:
            log_err ("nvm: Error when start NVMe standard.\n");
            break;
        case ECH_CONFIG:
            log_err ("nvm: a channel is not set correctly.\n");
            break;
        case EMEM:
            log_err ("nvm: Memory error.\n");
            break;
        case ESYNC_IO:
            log_err ("nvm: Synchronous IO failed.\n");
            break;
        default:
            log_err ("nvm: unknown error.\n");
    }
}

static void nvm_print_log ()
{
    printf("OX Controller started succesfully. "
            "Log: /var/log/nvme.log\n");

    log_info("[nvm: OX Controller ready.]\n");
    log_info("  [nvm: Active pci handler: %s]\n", core.nvm_pcie->name);
    log_info("  [nvm: %d media manager(s) up, total of %d channels]\n",
                                           core.mmgr_count, core.nvm_ch_count);

    int i;
    for(i=0; i<core.nvm_ch_count; i++){
        log_info("    [channel: %d, FTL id: %d"
                            " ns_id: %d, ns_part: %d, pg: %lu, in_use: %d]\n",
                            core.nvm_ch[i]->ch_id, core.nvm_ch[i]->i.ftl_id,
                            core.nvm_ch[i]->i.ns_id, core.nvm_ch[i]->i.ns_part,
                            core.nvm_ch[i]->ns_pgs, core.nvm_ch[i]->i.in_use);
    }
    log_info("  [nvm: namespace size: %lu bytes]\n",
                                                core.nvm_nvme_ctrl->ns_size[0]);
    log_info("    [nvm: total pages: %lu]\n",
                                  core.nvm_nvme_ctrl->ns_size[0] / NVM_PG_SIZE);
}

static void nvm_jump (int signal) {
    longjmp (core.jump, 1);
}

int nvm_memcheck (void *mem) {
    int invalid = 0;
    volatile char p;
    signal (SIGSEGV, nvm_jump);
    if (!setjmp (core.jump))
        p = *(char *)(mem);
    else
        invalid = 1;
    signal (SIGSEGV, SIG_DFL);
    return invalid;
}

int nvm_test_unit (struct nvm_init_arg *args)
{
    if (core.tests_init->init) {
        core.tests_init->geo.n_blk = LNVM_BLK_LUN;
        core.tests_init->geo.n_ch =  LNVM_CH;
        core.tests_init->geo.n_lun = LNVM_LUN_CH;
        core.tests_init->geo.n_pg =  LNVM_PG_BLK;
        core.tests_init->geo.n_sec = LNVM_SEC_PG;
        core.tests_init->geo.n_pl =  LNVM_PLANES;
        core.tests_init->geo.sec_sz = LNVM_SECSZ;
        return core.tests_init->init(args);
    } else
        printf(" Tests are not compiled.\n");

    return -1;
}

int nvm_admin_unit (struct nvm_init_arg *args)
{
    if (!core.tests_init->admin) {
        printf(" Ox Administration is not compiled.\n");
        return -1;
    }
    return 0;
}

int nvm_init_ctrl (int argc, char **argv)
{
    int ret, exec;
    pthread_t mode_t;
    void *(*modet_fn)(void *);

    core.tests_init = &tests_is;

    exec = cmdarg_init(argc, argv);
    if (exec < 0)
        goto OUT;

    openlog("NVME",LOG_CONS | LOG_PID | LOG_NDELAY, LOG_LOCAL0);
    LIST_INIT(&mmgr_head);
    LIST_INIT(&ftl_head);

    printf("OX Controller is starting. Please, wait...\n");
    log_info("[nvm: OX Controller is starting...]\n");

    ret = nvm_init();
    if(ret)
        goto CLEAN;

    nvm_print_log();

    switch (exec) {
        case OX_TEST_MODE:
            modet_fn = core.tests_init->start;
            break;
        case OX_ADMIN_MODE:
            modet_fn = core.tests_init->admin;
            break;
        case OX_RUN_MODE:
            core.run_flag ^= RUN_TESTS;
            while(!core.nvm_nvme_ctrl->running)
                usleep(NVM_SEC);
            break;
        default:
            goto CLEAN;
    }

    if (core.tests_init->init) {
        pthread_create(&mode_t, NULL, modet_fn, NULL);
        pthread_join(mode_t, NULL);
    }

    goto OUT;
CLEAN:
    printf(" ERROR 0x%x. Aborting. Check log file.\n", ret);
    nvm_printerror(ret);
    nvm_clean_all();
    return -1;
OUT:
    nvm_clean_all();
    return 0;
}

int main (int argc, char **argv)
{
    return nvm_init_ctrl (argc, argv);
}