Sql query到pyspark据框功能

Question 1

我想要复制下代码使用pyspark据框职能，而不是SQL query.

spark.sql("select date from walmart_stock order by high desc limit 1").show()

链接的数据集

Question 2

这里是代码，如果你开始，从联CSV文件。你应该认识到SQL功能。注意，我们使用 inferSchema 选项，以便直接分析的数字为双倍，并取得正确的排序(这将不是预期的作用默认串的类型)。另一种方法是铸列在读CSV。

spark.read
    .option("header", "true")
    .option("inferSchema", "true")
    .csv("walmart_stock.csv")
    .orderBy(f.col("High"), desc=True)
    .limit(1)
    .select("Date")
    .show()

这将产生

+----------+
|      Date|
+----------+
|2015-11-13|
+----------+

Oli · Answer 1 · 2021-11-23T14:21:37

这里是代码，如果你开始，从联CSV文件。你应该认识到SQL功能。注意，我们使用 inferSchema 选项，以便直接分析的数字为双倍，并取得正确的排序(这将不是预期的作用默认串的类型)。另一种方法是铸列在读CSV。

spark.read
    .option("header", "true")
    .option("inferSchema", "true")
    .csv("walmart_stock.csv")
    .orderBy(f.col("High"), desc=True)
    .limit(1)
    .select("Date")
    .show()

这将产生

+----------+
|      Date|
+----------+
|2015-11-13|
+----------+

我创建了一个表叫walmart_stock和与它的工作。是的从你的代码，我得到了我的答案。谢谢你。

Sql query到pyspark据框功能

的问题

最好的答案

其他语言

此页面有其他语言版本

受欢迎的此类别

流行的问题，在这个类别