Я пытаюсь соединить две таблицы в spark sql. Каждая таблица имеет более 50 столбцов. Оба имеют столбец id
в качестве ключа.
spark.sql("select * from tbl1 join tbl2 on tbl1.id = tbl2.id")
В объединенной таблице есть дублированный столбец id
.
Конечно, мы можем указать, какой столбец id
сохранить, как показано ниже:
spark.sql("select tbl1.id, .....from tbl1 join tbl2 on tbl1.id = tbl2.id")
Но так как у нас так много столбцов в обеих таблицах, я не хочу вводить имена всех остальных столбцов в приведенном выше запросе. (кроме столбца id
, других повторяющихся имен столбцов нет).
что мне делать? спасибо.
Undefined function: 'using'
В Spark SQL нет пункта using. @Гордон Линофф@зесла. . . Это может быть версия, которую вы используете. Определенно есть пункт
using
: spark.apache.org/docs/latest/….Работал нормально в 3.1.2. Благодарю вас!