如何在 Jupyter 笔记本中将列表输出为表格?

Posted

技术标签:

【中文标题】如何在 Jupyter 笔记本中将列表输出为表格?【英文标题】:How do I output lists as a table in Jupyter notebook? 【发布时间】:2016-05-11 15:48:33 【问题描述】:

我知道我以前在某个地方看到过一些例子,但我一生都在谷歌搜索时找不到它。

我有一些数据行:

data = [[1,2,3],
        [4,5,6],
        [7,8,9],
        ]

我想在表格中输出这些数据,例如

+---+---+---+
| 1 | 2 | 3 |
+---+---+---+
| 4 | 5 | 6 |
+---+---+---+
| 7 | 8 | 9 |
+---+---+---+

显然我可以使用像 prettytable 这样的库或下载 pandas 或其他东西,但我对此非常不感兴趣。

我只想将我的行作为表格输出到我的 Jupyter 笔记本单元格中。我该怎么做?

【问题讨论】:

您只想使用print 函数吗?数字的宽度是否固定(1位,3位? 这里我写了pythonic抽象。轻松编写代码。 :) jupyter_table_class.py 我很好奇你不想下载 prettytable 或 pandas 的理由是什么...... 2016 年是一辈子的事了。可能当时下载 pandas 的速度非常慢。 【参考方案1】:

我刚刚发现tabulate 有一个 html 选项,而且使用起来相当简单。

更新:从 Jupyter v6 及更高版本开始,返回的 table 应该只通过输出单元呈现:

import tabulate
data = [["Sun",696000,1989100000],
         ["Earth",6371,5973.6],
         ["Moon",1737,73.5],
         ["Mars",3390,641.85]]
table = tabulate.tabulate(data, tablefmt='html')
table

至于 Jupyter v5 或更早版本,您可能需要更加明确,类似于 Werner 的回答:

from IPython.display import HTML, display
display(HTML(table))

仍在寻找一些易于使用的东西来创建更复杂的表格布局,例如使用 Latex 语法和格式来合并单元格并在笔记本中进行变量替换:Allow references to Python variables in Markdown cells #2958

【讨论】:

对齐字符串对我不起作用!它不会将字符串向左对齐! @MojtabaKhodadadi 没有仔细检查,但看起来您可以为 srtings 与数字 here 设置默认列参数。 现在即使只是 tabulate.tabulate(table, tablefmt='html') 似乎也可以工作(尝试过 Jupyter 6.0.3、JupyterLab 2.0.1)。不错!【参考方案2】:

您可以添加自己的格式化程序。 递归 是可选的,但非常好。

在JupyterLite试试这个:

from html import escape

fmtr = get_ipython().display_formatter.formatters['text/html']

def getfmtr(obj, func=None):
    if fmtr.for_type(type(obj)):
        return fmtr.for_type(type(obj))(obj)
    else:
        return escape(obj.__str__()).replace("\n", "<br>")

def strfmtr(obj):
    return escape(obj.__str__()).replace("\n", "<br>")

fmtr.for_type(str, strfmtr)

def listfmtr(self):
    _repr_ = []
    _repr_.append("<table>")
    for item in self:
        _repr_.append("<tr>")
        _repr_.append("<td>")
        _repr_.append(getfmtr(item))
        _repr_.append("<td>")
        _repr_.append("</tr>")
    _repr_.append("</table>")
    return str().join(_repr_)

fmtr.for_type(list, listfmtr)

def dictfmtr(self):
    _repr_ = []
    _repr_.append("<table>")
    for key in self:
        _repr_.append("<th>")
        _repr_.append(getfmtr(key))
        _repr_.append("<th>")
    _repr_.append("<tr>")
    for key, value in self.items():
        _repr_.append("<td>")
        _repr_.append(getfmtr(value))
        _repr_.append("<td>")
    _repr_.append("</tr>")
    _repr_.append("</table>")
    return str().join(_repr_)

fmtr.for_type(dict, dictfmtr)

[
    "Jupyter is really cool!",
    [1, 2],
    [
        "Name": "Adams", "Age": 32,
        "Name": "Baker", "Age": 32
    ]
]

【讨论】:

【参考方案3】:

如果你不介意使用一点 html,这样的东西应该可以工作。

from IPython.display import HTML, display

def display_table(data):
    html = "<table>"
    for row in data:
        html += "<tr>"
        for field in row:
            html += "<td><h4>%s</h4></td>"%(field)
        html += "</tr>"
    html += "</table>"
    display(HTML(html))

然后像这样使用它

data = [[1,2,3],[4,5,6],[7,8,9]]
display_table(data)

【讨论】:

【参考方案4】:

我最近使用prettytable 来渲染一个漂亮的 ASCII 表。它类似于 postgres CLI 输出。

import pandas as pd
from prettytable import PrettyTable

data = [[1,2,3],[4,5,6],[7,8,9]]
df = pd.DataFrame(data, columns=['one', 'two', 'three'])

def generate_ascii_table(df):
    x = PrettyTable()
    x.field_names = df.columns.tolist()
    for row in df.values:
        x.add_row(row)
    print(x)
    return x

generate_ascii_table(df)

输出:

+-----+-----+-------+
| one | two | three |
+-----+-----+-------+
|  1  |  2  |   3   |
|  4  |  5  |   6   |
|  7  |  8  |   9   |
+-----+-----+-------+

【讨论】:

【参考方案5】:

我终于重新找到了我一直在寻找的jupyter/IPython documentation。

我需要这个:

from IPython.display import HTML, display

data = [[1,2,3],
        [4,5,6],
        [7,8,9],
        ]

display(HTML(
   '<table><tr></tr></table>'.format(
       '</tr><tr>'.join(
           '<td></td>'.format('</td><td>'.join(str(_) for _ in row)) for row in data)
       )
))

(我可能稍微搞砸了理解,但 display(HTML('some html here')) 是我们需要的)

【讨论】:

【参考方案6】:

有一个不错的技巧:用 pandas DataFrame 包装数据。

import pandas as pd
data = [[1, 2], [3, 4]]
pd.DataFrame(data, columns=["Foo", "Bar"])

它显示如下数据:

  | Foo | Bar |
0 | 1   | 2   |
1 | 3   | 4   |

【讨论】:

作为一个除了数据科学以外都绝对喜欢 python 的人,看到九行、四重导入、三重函数调用的答案在最佳答案字面上是“a熊猫数据框。”我的启发是:“如果它很长——它可能是错误的!” 您甚至可以使用to_html() 将DataFrame 显示为HTML,请参阅***.com/a/29665452/2866660 谢谢!是的,接受的答案一定要改成这个。 如果你已经有了 Pandas,那肯定很简单,但如果你没有,用它来打印表格有点“大锤破解”【参考方案7】:

我想输出一个表格,其中每列的宽度尽可能小, 其中列用空格填充(但可以更改),行由换行符分隔(但可以更改)并且每个项目都使用str 格式化(但是...)。


def ftable(tbl, pad='  ', sep='\n', normalize=str):

    # normalize the content to the most useful data type
    strtbl = [[normalize(it) for it in row] for row in tbl] 

    # next, for each column we compute the maximum width needed
    w = [0 for _ in tbl[0]]
    for row in strtbl:
        for ncol, it in enumerate(row):
            w[ncol] = max(w[ncol], len(it))

    # a string is built iterating on the rows and the items of `strtbl`:
    #   items are  prepended white space to an uniform column width
    #   formatted items are `join`ed using `pad` (by default "  ")
    #   eventually we join the rows using newlines and return
    return sep.join(pad.join(' '*(wid-len(it))+it for wid, it in zip(w, row))
                                                      for row in strtbl)

函数签名ftable(tbl, pad=' ', sep='\n', normalize=str) 及其默认参数旨在 提供最大的灵活性。

你可以自定义

pad叮, 行sep分隔符,(例如,pad='&amp;', sep='\\\\\n' 拥有 LaTeX 表格的大部分内容) 用于将输入规范化为公共字符串的函数 格式 --- 默认情况下,为了最大的通用性,它是 str 但如果 你知道你所有的数据都是浮点数lambda item: "%.4f"%item 可能是一个合理的选择,等等。

表面测试:

我需要一些测试数据,可能涉及不同宽度的列 所以算法需要更复杂一点(但只是一点点;)

In [1]: from random import randrange

In [2]: table = [[randrange(10**randrange(10)) for i in range(5)] for j in range(3)]

In [3]: table
Out[3]: 
[[974413992, 510, 0, 3114, 1],
 [863242961, 0, 94924, 782, 34],
 [1060993, 62, 26076, 75832, 833174]]

In [4]: print(ftable(table))
974413992  510      0   3114       1
863242961    0  94924    782      34
  1060993   62  26076  75832  833174

In [5]: print(ftable(table, pad='|'))
974413992|510|    0| 3114|     1
863242961|  0|94924|  782|    34
  1060993| 62|26076|75832|833174

【讨论】:

【参考方案8】:

我以前也有同样的问题。我找不到任何可以帮助我的东西,所以我最终在下面创建了 PrintTable--code 课程。还有一个输出。用法很简单:

ptobj = PrintTable(yourdata, column_captions, column_widths, text_aligns)
ptobj.print()

或一行:

PrintTable(yourdata, column_captions, column_widths, text_aligns).print()

输出:

-------------------------------------------------------------------------------------------------------------
  Name                                     | Column 1   | Column 2   | Column 3   | Column 4   | Column 5    
-------------------------------------------------------------------------------------------------------------
  Very long name 0                         |          0 |          0 |          0 |          0 |          0  
  Very long name 1                         |          1 |          2 |          3 |          4 |          5  
  Very long name 2                         |          2 |          4 |          6 |          8 |         10  
  Very long name 3                         |          3 |          6 |          9 |         12 |         15  
  Very long name 4                         |          4 |          8 |         12 |         16 |         20  
  Very long name 5                         |          5 |         10 |         15 |         20 |         25  
  Very long name 6                         |          6 |         12 |         18 |         24 |         30  
  Very long name 7                         |          7 |         14 |         21 |         28 |         35  
  Very long name 8                         |          8 |         16 |         24 |         32 |         40  
  Very long name 9                         |          9 |         18 |         27 |         36 |         45  
  Very long name 10                        |         10 |         20 |         30 |         40 |         50  
  Very long name 11                        |         11 |         22 |         33 |         44 |         55  
  Very long name 12                        |         12 |         24 |         36 |         48 |         60  
  Very long name 13                        |         13 |         26 |         39 |         52 |         65  
  Very long name 14                        |         14 |         28 |         42 |         56 |         70  
  Very long name 15                        |         15 |         30 |         45 |         60 |         75  
  Very long name 16                        |         16 |         32 |         48 |         64 |         80  
  Very long name 17                        |         17 |         34 |         51 |         68 |         85  
  Very long name 18                        |         18 |         36 |         54 |         72 |         90  
  Very long name 19                        |         19 |         38 |         57 |         76 |         95  
-------------------------------------------------------------------------------------------------------------

PrintTable的代码

# -*- coding: utf-8 -*-

# Class
class PrintTable:
    def __init__(self, values, captions, widths, aligns):
    if not all([len(values[0]) == len(x) for x in [captions, widths, aligns]]):
        raise Exception()
    self._tablewidth = sum(widths) + 3*(len(captions)-1) + 4
    self._values = values
    self._captions = captions
    self._widths = widths
    self._aligns = aligns

    def print(self):
    self._printTable()

    def _printTable(self):
    formattext_head = ""
    formattext_cell = ""
    for i,v in enumerate(self._widths):
        formattext_head += "" + str(i) + ":<" + str(v) + " | "
        formattext_cell += "" + str(i) + ":" + self._aligns[i] + str(v) + " | "
    formattext_head = formattext_head[:-3]
    formattext_head = "  " + formattext_head.strip() + "  "
    formattext_cell = formattext_cell[:-3]
    formattext_cell = "  " + formattext_cell.strip() + "  "

    print("-"*self._tablewidth)
    print(formattext_head.format(*self._captions))
    print("-"*self._tablewidth)
    for w in self._values:
        print(formattext_cell.format(*w))
    print("-"*self._tablewidth)

示范

# Demonstration

headername = ["Column ".format(x) for x in range(6)]
headername[0] = "Name"
data = [["Very long name ".format(x), x, x*2, x*3, x*4, x*5] for x in range(20)] 

PrintTable(data, \
       headername, \
       [70, 10, 10, 10, 10, 10], \
       ["<",">",">",">",">",">"]).print()

【讨论】:

【参考方案9】:

一组通用函数,用于将任何 Python 数据结构(嵌套在一起的字典和列表)呈现为 HTML。

from IPython.display import HTML, display

def _render_list_html(l):
    o = []
    for e in l:
        o.append('<li>%s</li>' % _render_as_html(e))
    return '<ol>%s</ol>' % ''.join(o)

def _render_dict_html(d):
    o = []
    for k, v in d.items():
        o.append('<tr><td>%s</td><td>%s</td></tr>' % (str(k), _render_as_html(v)))
    return '<table>%s</table>' % ''.join(o)

def _render_as_html(e):
    o = []
    if isinstance(e, list):
        o.append(_render_list_html(e))
    elif isinstance(e, dict):
        o.append(_render_dict_html(e))
    else:
        o.append(str(e))
    return '<html><body>%s</body></html>' % ''.join(o)

def render_as_html(e):
    display(HTML(_render_as_html(e)))

【讨论】:

【参考方案10】:

tabletext 很合适

import tabletext

data = [[1,2,30],
        [4,23125,6],
        [7,8,999],
        ]

print tabletext.to_text(data)

结果:

┌───┬───────┬─────┐
│ 1 │     2 │  30 │
├───┼───────┼─────┤
│ 4 │ 23125 │   6 │
├───┼───────┼─────┤
│ 7 │     8 │ 999 │
└───┴───────┴─────┘

【讨论】:

这是 Python 2,请注意【参考方案11】:

好的,所以这比我难一点:

def print_matrix(list_of_list):
    number_width = len(str(max([max(i) for i in list_of_list])))
    cols = max(map(len, list_of_list))
    output = '+'+('-'*(number_width+2)+'+')*cols + '\n'
    for row in list_of_list:
        for column in row:
            output += '|' + ' :^widthd '.format(column, width = number_width)
        output+='|\n+'+('-'*(number_width+2)+'+')*cols + '\n'
    return output

这应该适用于可变数量的行、列和位数(对于数字)

data = [[1,2,30],
        [4,23125,6],
        [7,8,999],
        ]
print print_matrix(data)
>>>>+-------+-------+-------+
    |   1   |   2   |  30   |
    +-------+-------+-------+
    |   4   | 23125 |   6   |
    +-------+-------+-------+
    |   7   |   8   |  999  |
    +-------+-------+-------+

【讨论】:

【参考方案12】:

您可以尝试使用以下功能

def tableIt(data):
    for lin in data:
        print("+---"*len(lin)+"+")
        for inlin in lin:
            print("|",str(inlin),"", end="")
        print("|")
    print("+---"*len(lin)+"+")

data = [[1,2,3,2,3],[1,2,3,2,3],[1,2,3,2,3],[1,2,3,2,3]]

tableIt(data)

【讨论】:

以上是关于如何在 Jupyter 笔记本中将列表输出为表格?的主要内容,如果未能解决你的问题,请参考以下文章

如何在jupyter笔记本中将python字符串显示为HTML

如何在 jupyter 笔记本中将 tqdm 与 pandas 一起使用?

结合 Jupyter 丰富的显示和 matplotlib 图表

停止在 pandas html 表格输出中包装单元格内容的 jupyter notebook

如何在python中将光标列表转换为JSON格式?

如何在ios6.1中将表格视图列表显示为封面流